网新关键词

作者: 棋时 | 来源:发表于2017-12-10 14:40 被阅读0次

    一、关于协同过滤的定义及实例

    协同过滤示意图.jpg

    协同过滤的定义

    定义一

    协同过滤是利用某兴趣相投、拥有共同经验之群体的喜好来推断用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

    协同过滤又可分为评比或者群体过滤,协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热。 (来自百度百科)

    定义二

    协同过滤是推荐系统中应用最为广泛的技术之一,它基于一组兴趣相同的用户进行推荐。协同过滤基于这样的假设:为用户找到他真正感兴趣的内容的好方法是,首先找他与他兴趣相似的用户,然后将这些用户感兴趣的内容推荐给此用户。这个基本思想是不是和现在颇为流行的“口碑传播”有点儿类似?其实这个非常直观,相信大家都有体会,在现实生活里,对自己最有效的信息,往往是来自于朋友们的推荐。

    协同过滤技术可以分为三类:基于用户的协同过滤;基于项目的协同过滤;基于模型的协同过滤。 (来自360图书馆网友分享)

    定义三

    协同过滤,有广义狭义两种定义。现在讨论较多的是狭义的定义,在电商网站应用比较广泛。狭义的定义指的是,通过收集群体用户的偏好信息,自动化预测(过滤)个体用户可能感兴趣的内容。协同是群体行为,过滤则是针对个人的行为。

    协同过滤依赖用户偏好信息,偏好又称为用户评分,分为主动评分被动评分。自动评分指用户使用系统提供的方式进行评分或者评价; 被动评分则根据使用者的行为模式由系统代替使用者完成评价。 (源自维基百科)

    小结:我认为最佳的定义是定义二。1.它的解释很清晰,很简洁明了,它还举了一个比较贴切好理解的例子。2.它还将协同过滤技术进行了分类,使读者或者说是用户能更明确的知道自己在进行着什么行为以及这种行为基于什么。我认为这是定义二与其他定义的最大不同,也正是这一点我认为它优于其他的定义

    国内事例

    豆瓣

    豆瓣是国内做的比较成功的社交网站,它以图书,电影,音乐和同城活动为中心,形成一个多元化的社交网络平台,自然推荐的功能是必不可少的。当你在豆瓣电影中将一些你看过的或是感兴趣的电影加入你看过和想看的列表里,并为它们做相应的评分,这时豆瓣的推荐引擎已经拿到你的一些偏好信息, 豆瓣的推荐是通过“豆瓣猜”,为了让用户清楚这些推荐是如何来的,豆瓣还给出了“豆瓣猜”的一个简要的介绍。 “你的个人推荐是根据你的收藏和评价自动得出的,每个人的推荐清单都不同。你的收藏和评价越多,豆瓣给你的推荐会越准确和丰富。 每天推荐的内容可能会有变化。随着豆瓣的长大,给你推荐的内容也会越来越准。” 这一点让我们可以清晰明了的知道,豆瓣必然是基于社会化的协同过滤的推荐,这样用户越多,用户的反馈越多,那么推荐的效果会越来越准确。 相对于 Amazon 的用户行为模型,豆瓣电影的模型更加简单,就是“看过”和“想看”,这也让他们的推荐更加专注于用户的品味,毕竟买东西和看电影的动机还是有很大不同的。 另外,豆瓣也有基于物品本身的推荐,当你查看一些电影的详细信息的时候,他会给你推荐出“喜欢这个电影的人也喜欢的电影”,

    推荐理由:1.豆瓣是国内比较成功的社交网络,它的影响范围较广,受众较多。2.豆瓣的推荐是通过“豆瓣猜”。豆瓣猜的运行方式是:你的个人推荐是根据你的收藏和评价自动得出,每个人的推荐清单都不同。你的收藏和评价越多,豆瓣给你的推荐会越准确和丰富。通过这一点可以看出豆瓣是基于社会化的协同过滤的推荐

    国外事例

    Amazon

    Amazon利用可以记录的所有用户在站点上的行为,根据不同数据的特点对它们进行处理,并分成不同区为用户推送推荐:

    今日推荐 (Today's Recommendation For You): 通常是根据用户的近期的历史购买或者查看记录,并结合时下流行的物品给出一个折中的推荐。

    新产品的推荐(New For You): 采用了基于内容的推荐机制 (Content-based Recommendation),将一些新到物品推荐给用户。在方法选择上由于新物品没有大量的用户喜好信息,所以基于内容的推荐能很好的解决这个“冷启动”的问题。

    捆绑销售 (Frequently Bought Together): 采用数据挖掘技术对用户的购买行为进行分析,找到经常被一起或同一个人购买的物品集,进行捆绑销售,这是一种典型的基于项目的协同过滤推荐机制。

    别人购买 / 浏览的商品 (Customers Who Bought/See This Item Also Bought/See): 这也是一个典型的基于项目的协同过滤推荐的应用,通过社会化机制用户能更快更方便的找到自己感兴趣的物品。

    值得一提的是,Amazon 在做推荐时,设计和用户体验也做得特别独到:

    Amazon 利用有它大量历史数据的优势,量化推荐原因。

    •基于社会化的推荐,Amazon 会给你事实的数据,让用户信服,例如:购买此物品的用户百分之多少也购买了那个物品;

    •基于物品本身的推荐,Amazon 也会列出推荐的理由,例如:因为你的购物框中有 ***,或者因为你购买过 ***,所以给你推荐类似的 ***。

    另外,Amazon 很多推荐是基于用户的 profile 计算出来的,用户的 profile 中记录了用户在 Amazon 上的行为,包括看了那些物品,买了那些物品,收藏夹和 wish list 里的物品等等,当然 Amazon 里还集成了评分等其他的用户反馈的方式,它们都是 profile 的一部分,同时,Amazon 提供了让用户自主管理自己 profile 的功能,通过这种方式用户可以更明确的告诉推荐引擎他的品味和意图是什么。


    二、常用搜索引擎语法

    Google .jpg

    site

    Google 提供的site搜索语法是Google最重要的搜索语法之一。Bing提供的site搜索语法是Bing最重要的搜索语法之一。百度、雅虎等各大搜索引擎都支持该指令。

    Domain

    查询网站的反向链接情况,这个命令只适用于百度,并且结果并不是那么的让人满意。因为他查出来的结果不是反链,效果还不如双引号(“”),domain用法:domain:ask.yuayng.org

    link

    是一个常用的高级指令,用于查询url的反向链接,只有google支持该指令,但查询结果不准确。Bing不支持

    link domain

    该指令也是用于查询域名的反向链接,但只有雅虎支持,用雅虎来查网站的反向链接数据比较准确,所以都会用雅虎的linkdomain:命令查询一个网站的反向链接。Bing不支持

    inurl

    用于搜索查询呈现在inurl 中的页面,baidu和google均支持该指令。

    指令格式:inurl:医院网络营销 返回的结果是url包含“医院网络营销”的页面,支持中英文。   使用技巧:inurl命令可以准确查询个人博客的收录情况,比如:我在百度申请了一个用户名为jiangkanek的博客,那么我们准确的查询博客收录呢?正确的查询方法是 site:hi.baidu.com inurl:jiankangek 这条命令的意思就是hi.baidu.com 包含jiankangek(用户名)的页面。Bing不支持 但inurl可以

    allinurl

    与inurl相似,区别在于allinurl指令可以同时查询多个关键词

    指令格式:allinurl:医院网络营 推广技巧 相当于inurl:医院网络营销 inurl:医院推广技巧。Bing不支持

    inanchor

    导入链接锚文字中包含搜索词的页面,baidu不支持该指令。Bing支持

    指令格式:inanchor:医院网络营销 返回的结果页面本身不一点包含“医院网络营销”这几个字,而是指向这些页面的链接锚文字中出现了“医院网络营销”这几个字。

    使用技巧:利用该指令可以找到竞争对手到哪些网站去发布过外链,这也是一个快速找外链资源的方法,可惜的是baidu不支持。

    intitle

    该指令返回的结果是页面title包含关键词,baidu和google以及Bing均支持该指令。

    指令格式:intitle:医院网络营销   使用技巧:比如我们要查询“医院网络营销”这个关键词的竞争对手,那么用intitle指令查询返回的结果中将是你最强的竞争对手。

    allintitle

    该指令和intitle意思差不多,也是查询页面title包含关键词,唯一的却别在于   allintitle指令可以同时查询多个关键词。

    指令格式:intitle:医院网络营销 医院推广技巧 相当于intitle:医院网络营销 intitle:医院推广技巧

    filetype

    用于搜索特定文件格式,baidu和google以及Bing均支持该指令   指令格式:filetype:医院网络方案 doc 返回的是包含“医院网络方案”的文档

    (-)减号

    减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必需是空格,减号后面没有空格,紧跟着需求排除的词,baidu和Google 均支持该指令。

    例如:搜索 -引擎 返回的结果则是包含“搜索”这个词,却不包含“引擎”这个词的结果。

    (“”)双引号

    把搜索词放在双引号中,代表完整匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有词,必需完整匹配,baidu和Google 都支持这个指令。

    例如:百度首页中搜索百度百科带双引号搜索则能够搜索到分别以“百度百科”、“双引号”和“搜索”为关键字的结果。但是百度首页中搜索“百度百科带双引号搜索”则只能够搜索以“百度百科带双引号搜索”为关键字的结果。

    例如搜索:“医院网络营销”返回的结果是完整匹配出来没通过分词的页面

    (*)星号

    星号是常用的通配符,也能够用在搜索中,baidu不支持星号搜索指令。

    星号适用Google:现在百度、soso和搜狗三个搜索引擎不支持号,而Goolge支持

    以上是常用的高级搜索引擎命令,在做seo的过程中会经常使用到,欢迎大家补充。


    三、 网络新媒体与协作的基础条目

    维基百科.jpg

    1.IP地址

    “网络之间互连的协议”,也就是为计算机网络相互连接进行通信而设计的协议。

    2.开源新经济

    自愿兴趣驱动为原则,让自愿者参与产业设计(技术分散)、闲置资源共享、协同过滤信息

    3.搜素引擎

    学会使用搜索引擎是网络与新媒体专业必须掌握的技能。搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是研究网站用户行为的一个有效工具,高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售,而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值

    4.协同过滤

    其广泛用于各类推荐系统,即基于一组兴趣相同的用户进行推荐,分为评比或者群体过滤。个人通过合作机制给予信息并回应,达到过滤的目的,帮助别人筛选信息。除感兴趣信息外,特别不感兴趣信息的纪录相当重要。

    5.数字化时代的思维模式

    数字化使人类实现了由现实性的生存方式向虚拟性的生存方式的超越,实践方式决定思维方式,人类的思维方式相应地也要实行转换.与数字化相适应的思维方式是超越性思维方式.超越性思维方式的特征是虚拟性、个体性、非线性、批判性、创造性、非理性、敏捷性、集成性..

    6.XML技术

    可扩展标记语言XML(eXtensible Markup Language)是一种简单灵活的文本格式的可扩展标记语言,起源于SGML(Standard Generalized Markup Language),是SGML的一个子集合,也就是SGML的一个简化版本,非常适合于在Web上或者其它多种数据源间进行数据的交换。

    7.URL(统一资源定位符)

    包含的信息支出文件的位置以及浏览器应该怎么处理

    8.RSS(简易信息聚合)

    能在其他的终端和服务中使用,是一种描述和同步网站内容的格式

    9.互联网

    互联网是指网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议TCP(Transmission Control Protocol 传输控制协议)和 IP (Internet Protocol网间协议)相连,形成逻辑上的单一且巨大的全球化网络。在这个网络中有数不尽的计算机、终端,可以将信息瞬间发送到千里之外的人手中,是信息社会的基础。

    10.网络安全

    网络安全是指网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或者恶意的原因而遭受到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。 主要特征:保密性、完整性、可用性、可控性、可审查性。 主要类型:系统安全、网络的安全、信息传播的安全、信息内容安全。

    11.Markdown语言

    Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。

    Markdown具有一系列衍生版本,用于扩展Markdown的功能(如表格、脚注、内嵌HTML等等),这些功能原初的Markdown尚不具备,它们能让Markdown转换成更多的格式,例如LaTeX,Docbook。Markdown增强版中比较有名的有Markdown Extra、MultiMarkdown、 Maruku等。这些衍生版本要么基于工具,如Pandoc;要么基于网站,如GitHub和Wikipedia,在语法上基本兼容,但在一些语法和渲染效果上有改动。

    未完待续。


    四、万维网

    万维网.jpg

    1.定义

    万维网是一个由许多互相链接的超文本组成的系统,通过互联网访问,分为Web客户端和Web服务器程序,发明者是蒂姆·伯纳斯-李。 在这个系统中,每个有用的事物,称为一样“资源”;并且由一个全局“统一资源标识符”(URI)标识;这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给用户,而后者通过点击链接来获得资源。

    2.万维网联盟

    万维网联盟.jpg

    万维网联盟(World Wide Web Consortium,W3C)是Web技术领域最具权威和影响力的国际中立性技术标准机构,创建于1994年10月,原为欧洲核子研究组织的一个项目。万维网联盟是国际最著名的标准化组织,主要工作是发展Web规范。它已发布200多项影响深远的Web技术标准及实施指南,如广为业界采用的超文本标记语言(标准通用标记语言下的一个应用)、可扩展标记语言(标准通用标记语言下的一个子集)以及帮助残障人士有效获得Web内容的信息无障碍指南(WCAG)等,有效促进了Web技术的互相兼容,对互联网技术的发展和应用起到了基础性和根本性的支撑作用。

    3.万维网技术

    万维网技术简述.jpg

    分为Web客户端Web服务器程序。 可以让Web客户端(常用浏览器)访问浏览Web服务器上的页面。 是一个由许多互相链接的超文本组成的系统,通过互联网访问。在这个系统中,每个有用的事物,称为一样“资源”;并且由一个全局“统一资源标识符”(URI)标识;这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给用户,而后者通过点击链接来获得资源。

    4.NWiki协作

    Wiki.jpg
    Wiki是一种在网络上开放且可供多人协同创作的超文本系统,由沃德·坎宁安于1995年首先开发,这种超文本系统支持面向社群的协作式写作,同时也包括一组支持这种写作。沃德·坎宁安将wiki定义为“一种允许一群用户用简单的描述来创建和连接一组网页的社会计算系统”。Wiki站点可以有多人(甚至任何访问者)维护,每个人都可以发表自己的意见,或者对共同的主题进行扩展或者探讨。

    5.Unicode

    Unicode.png

    Unicode( 统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

    Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。目前的Unicode字符分为17组编排,0x0000 至 0xFFFF,每组称为平面(Plane),而每平面拥有65536个码位,共1114112个。然而目前只用了少数平面。** UTF-8、 UTF-16、 UTF-32**都是将数字转换到程序数据的编码方案。

    6.Github

    Github.png

    作为开源代码库以及版本控制系统,Github拥有超过900万开发者用户。随着越来越多的应用程序转移到了云上,Github已经成为了管理软件开发以及发现已有代码的首选方法。

    GitHub主要用Rails实现。我们在进行的post-commit集成小应用完全使用Merb编写。我们使用了Python的Pygments来做格式高亮显示,另外,还用了Ara T. Howard's Bj加上一些Ruby 脚本来做我们的 排队系统。当然,我们用了Ruby Grit库来和Git进行交互。

    7. IETF 语言标记

    IETF.png

    每个 IETF 语言标记,都由一些子标记组成;一个完整的 IETF 语言标记,可能包括下面这些子标记:
    (1) 必选的语言标记(language subtag);
    (2) 可选的拓展语言标记(extended language subtag);
    (3) 可选的书写标记(script subtag);
    (4) 可选的地区标记(region subtag);
    (5) 可选的变种标记(variant subtag);
    (6) 可选的扩展标记(extension subtag);
    (7) 以及可选的私有标记(private subtag)。

    这仅代表我个人的想法,希望大家能给我一些建议。

    参考文献:

    百度百科百度知道豆瓣
    《网络素养》

    相关文章

      网友评论

        本文标题:网新关键词

        本文链接:https://www.haomeiwen.com/subject/yvqvixtx.html