当前位置: CNMO > 新闻 > 正文

豌豆荚“应用内搜索” 周年发布会速记

CNMO 【厂商稿】 作者:王孜 2014-10-17 02:09
评论(0
分享

  主持人:各位媒体朋友,来自「穷游」、「快的」、「知乎」的几位合作伙伴,大家下午好。今天我们见面的地方是在豌豆荚新办公室,为了想方设法让大家来我们办公室,今天的见面会我们中间改了一次场地。为什么特别想在我们办公室见大家呢?正好是一年之前我们在豌豆荚旧的办公室见了大家,我们刚刚发布「应用内搜索」,当时有几个很有想象力的关于「应用内搜索」的DEMO。

豌豆荚“应用内搜索” 周年发布会速记
发布会现场

  这次我们分享不是一鸣惊人的新产品、新政策,而是这一年来下来我们对比一年前,「应用内搜索」到底做了一些什么事情?有什么新的想法?有什么新的认识?这是今天想和大家分享的内容。

  今天的两位发言人,一位是产品设计副总裁刘亚平,一位是搜索平台负责人「应用内搜索」技术的掌舵者李大海。首先请两位和大家分享我们在产品方面所取得的进展。

  刘亚平:大家好,我是刘亚平,豌豆荚产品设计负责人。在座很多老朋友,很高兴在我们漂亮的新办公室见到大家,今天天气也不错,所以还是很合适的时机和地点。

豌豆荚“应用内搜索” 周年发布会速记
豌豆荚产品设计副总裁刘亚平

  一年前正式发布我们的「视频搜索」产品,相当于全世界第一个实现把「应用内搜索」这个技术产品化的实例。过去一年基本上每个季度都见到大家,和大家分享我们在「应用内搜索」这件事的进展和想法。今天我想稍微换一个套路,先不谈豌豆荚,我们看看行业内大家都在做什么,那些行业内的巨头、新的公司,这些小伙伴们都在做什么。

  说起来搜索,大家自然想到谷歌,2013年12月谷歌发布了App  Indexing的技术标准,通过App Indexing,如果你在谷歌上搜索信息,尤其是搜索电影、房地产这几个门类的时候,会看到Open in apps的按钮,点进去可以跳到内容页面。半年之后的2014年谷歌在I/O开发者大会,宣布扩大App Indexing的范围,开始对所有的应用开发者开放,允许所有用户提交数据,接入到谷歌的「应用内搜索」技术上。目前为止,谷歌接入了不到100家的应用。

  说起来「应用内搜索」,很多人可能想到另外一家公司Quixey,在2013年8月之前,它还是一家没有多少人知道的公司,2013年8月Quixey发布了AppURL的标准,支持用户从一个应用跳到另一个页面的指令,当时这件事情非常有前瞻性。发布之后不到两个月时间,得到了阿里巴巴的5000万的融资。今年2月Quixey发布了一个新产品是Functional Search,它可以把应用内的信息呈现给用户。举一个很有趣的例子,如果在Quixey上搜索如何烤蛋糕,可以找到各个APP里面找烤蛋糕的信息,全面地呈现给你。

  2014年,Facebook发布了App Links产品和谷歌的App  Indexing和Quixey的AppURL类似,实现从一个应用跳转到另一个应用的功能,一直到7月份Facebook发布了另外一个产品,这个产品叫做Out app  purchase,熟悉苹果系统的人都比较熟悉这个,它实现了在Facebook平台上的游戏或者应用里面有一些商品、道具能够直接展示在游戏和应用之外,甚至可以直接购买道具,目前为止这个产品是Facebook的PC平台上、Web平台上才能做到的事情,业界普遍猜测它将同步到移动端。

  除了谷歌、Quixey、Facebook,我们列举的这些,还有Twitter、Flurry这些公司其实都有在「应用内搜索」这件事情上做探索,可以说这个方向是非常热闹,大大小小的玩家、大大小小的公司都来齐了。

  豌豆荚非常开心看到这样的行业内最知名、最有前瞻性、最创新的公司一起探索「应用内搜索」。

  同时,豌豆荚也是一家非常有创新的公司,加入这一波浪潮的时间是非常早的。在2013年7月豌豆荚正式发布了我们的视频搜索,视频搜索是全球第一个把「应用内搜索」技术产品化的实例。用户搜索一个视频可以直接跳转到搜狐视频中看一个具体视频。这是全球第一个把「应用内搜索」技术和概念产品化的实例。

  今年1月我们宣布了「移动内容搜索」,进一步把「应用内搜索」技术从视频扩展到包括电子书、壁纸。今年3月豌豆荚发布了我们的「应用内搜索」的技术协议,这个技术协议和其他的技术协议略有不同,标志着我们对移动应用有最好的支持。移动互联网时代很多应用没有自己的网站,这些没有网站的应用里面的内容在Web上看不到。即使一个应用开发者没有自己的网站或者它的内容、它的数据不适合展示在Web,移动应用开发者也能够很方便的把内容接入到豌豆荚的「应用内搜索」里面去。

  接下来我们看一个例子。2014年7月豌豆荚接了一个购票应用——「猫眼」。用户搜索热门电影的时候可以直接看到「购票」按钮,点击以后马上跳入「猫眼」电影里面去完成购票、选座这些很复杂的操作,豌豆荚把内容消费的场景从线上扩展到线下。整个用户消费内容场景得到了拓宽。

  近期还有很多类似的产品,一会儿和大家分享。刚才讲这么多都是过去一年发生的。过去一年在「应用内搜索」上的探索做了很多,大多数都拉近了用户和内容之间的距离。方便用户很快的消费内容,以前可能需要点开不同的App,在里面搜索,再找这些内容,现在只需要在豌豆荚里面输入关键字搜索,就可以快捷的访问这些内容。这些事情也得到了用户的认可,豌豆荚去年索引的视频数量大概是58万左右,一年之后有大量的开发者、大量的内容提供商的支持,我们跟他们有紧密的合作,现在索引的视频到242万,是四五倍的增长。豌豆荚索引的各个门类的内容也到了千万量级。豌豆荚的各个门类的用户达到了1.8亿,这是指除了豌豆荚传统的应用和游戏之外的消费用户已经达到了1.8亿。这是豌豆荚过去一年在「应用内搜索」这件事情上的探索和我们的成绩。

  再看看国内其他的公司。总体来说国内其他公司在「应用内搜索」这件事上关注比较少。国内做搜索的两个主要公司都有自己的尝试。首先看一下百度,百度2013年3月发布了「应用内搜索」,(图)用户能够很方便的在百度上搜索的时候从百度的一个应用跳转到另一个应用,主要的应用场景可能是在百度里面搜索的时候跳到百度地图或者爱奇艺。到今年1月份,百度开发者大会宣布百度向普通开发者开放「应用内搜索」技术,允许开发者申请把他的内容提交给百度做接入。

  360在今年1月份有消息称它会上线Open in App的功能,但我们一直没有看到真正的产品上线。到今年6月,360发布了360移动搜索,据透露下一步360将支持「应用内搜索」技术,从而打破各个App信息孤岛,这是周鸿祎透露的他们下一步产品的计划。

  刚才讲了这么多公司在「应用内搜索」上的探索,我们可以看到不管是国内还是国外,无论是大公司还是小公司,「应用内搜索」的趋势、方向其实得到了行业内广泛的认可。这件事情是大家都共同认同的方向和趋势。

  在移动互联网时代,应用内的内容其实是用户花绝大多数时间的,这些内容主要存在于应用内,但这些内容的确是孤岛,这些应用相互之间都没有联系。在百度里面,在一个视频应用找到一个视频,没有办法找到相关的内容去另一个视频App,用户也不知道要找一个视频应该去哪里找。举例来说,搜狐视频里面有百万集的视频数量,豌豆荚索引了170万个应用,这些内容的数量我们可以认为是天文数字。但当前用户并不知道我要找什么内容,应该去哪里。并没有这样的功能支持他做这样的事情。如果有一个地方输入一个关键字,就能够找到互联网上的所有内容是呼之欲出的。豌豆荚在这个大环境和大前提下发布了我们的「视频搜索」产品。

  提到搜索大家最容易想到的还是谷歌和百度这样的搜索引擎公司。为什么豌豆荚也要做「应用内搜索」呢?这个问题很多人都问过,总之来说谷歌和百度在PC时代基于Web的搜索体验做到了前所未有的高度,非常好,但是在移动互联网时代,移动互联网时代最基础的组成单元是应用并不是web,用户搜索到一个内容需要很快能够消费,比如购票,消费过程中可能有一些非常复杂的操作,需要整个使用体验非常顺畅、性能非常好,但这些都是Web不具备的,很难想象在web网页上点购票、选座,这非常难,web有一些天生性能上的劣势,这些问题都不能解决。另外一个很大的问题,web上很难记住个人偏好,比如个人帐号,「猫眼」电影里面很容易做到记录个人偏好,甚至记录支付信息。所以我们认为原生应用在这件事情上是非常有优势的。豌豆荚的「应用内搜索」技术很好地支持了原生应用,相对web使用体验好很多。

  刚才讲了这么多,都是从产品和用户角度和大家分享「应用内搜索」。大家知道,在移动互联网行业、IT行业一个好的产品背后一定有非常好的技术在支撑。说起谷歌大家很容易想起来「page rank」,说起亚马逊背后是有「AWS」来支撑的,所以我们的「应用内搜索」也是有很好技术支撑的,下面请大海分享「应用内搜索」技术背后的一些故事。
   
  李大海:我是豌豆荚搜索平台的技术负责人李大海:,豌豆荚在「应用内搜索」这个领域的进展除了有产品上看得见的进展、变化,背后也有很多关键的技术实现。这些技术实现就是我们搜索平台团队在过去一年里一直花费大量精力的地方。

豌豆荚“应用内搜索” 周年发布会速记
豌豆荚搜索平台的技术负责人李大海

  从技术上讲,过去一年是我们对自己的搜索引擎技术进行更新换代的一年。这一年的工作分为三方面:基础设施建设、搜索引擎基础架构建设、搜索质量优化。在基础设施建设方面,我们从应用搜索向全面的移动内容搜索扩展过程中,我们重新搭建了最底层的数据存储服务,搭建了能够支持1500台服务器的分布式的数据存储和计算的集群,除以支撑我们的爬虫索引整个中文互联网的应用,包括原生应用和网页应用内容。

  为了搭建高效的分布式的搜索系统,能够快速高效支持用户海量的查询,我们设计并实现了底层的通信服务,能够在我们的集群达到点对点通信20万次/秒的能力。

  在打好基础之后我们建立了一套新的搜索引擎机构。为什么搭建一个新的系统,因为我们相信移动内容搜索的规模一定超过传统网页的搜索规模。一方面,传统的网页内容一定逐步迁移到移动端。同时移动互联网不断地产生移动独有的内容。我们系统正是按照这个数据规模进行设计的。

  这样一套基础架构一共包含三部分:爬虫、数据流水线、检索系统。这也涵盖了内容的接入、内容处理、内容展现给用户三个阶段。

  爬虫,从产品上看,我们的内容是一个门类一个门类的接入,在技术上一开始就实现了一套通用的爬虫系统,能够支持不同门类的应用内容同时接入到我们系统。无论是视频应用还是天气应用,这样做不但能够大大节省计算资源,同时还能够大大的缩短整个接入新门类的时间。

  数据流水线,一个数据流水线就是把爬虫的内容进行一系列的程序处理,最后变成索引,然后体现到用户的搜索结果里面的过程。在搜索引擎里面,数据流水线主要有三种策略:集装箱式,爬虫抓取的内容堆积在那里,每隔一段时间,对新抓取的内容和所有老内容一起进行统一处理,变成一个全新的索引,然后一次性替换旧的索引。可以想象,在这种策略下,新挖取的内容要很长时间才能反映到我们的产品上。第二种是立体交通式,就像现实中的运输系统一样,会对内容进行分析,只有更新频率和质量都很高的内容才能得到实时处理和响应。其他的内容分情况每隔一小时、一天、一周甚至一个月处理一次。可以发现立体交通式是集装箱式的改进,但是很多内容改变不能够很有效及时的反映到系统里面。第三种是多米诺骨牌式,在这种策略下会把爬虫抓取进来的每一个内容都马上实时的进行处理。这个处理会分成很多小的步骤,每一个步骤就像一块多米诺骨牌,做完之后传递到下一块去。在这种方式下,显然爬虫抓取的每一块内容都能够很快得到处理,但是要求的技术难度更大一些。其实多米诺式的数据流水线也是近几年发展起来的,搜索业界还没有广泛使用。我们重新做系统设计的时候,我们决定采用这样一种方式,因为它能够给用户更大的价值。

  我们搜索结构的第三部分是检索系统。这个系统不仅能够支持不同门类内容之间的混排,而且性能比以前使用的解决方案高50倍。从爬虫到数据流水线,再到检索系统,这三部分构成了完整的搜索引擎的架构。而这个新的架构能够让我们实时为用户提供全面准确的搜索结果。

  举个例子,对于接入「应用内搜索」的视频应用来说,它里面某一个剧集的变化用户能够在短短的几分钟内就可以搜索到。

  我们工作的第三方面是搜索质量的优化。除了底层的搜索架构外,对这些底层技术进行产品化的时候,我们也面临一些新的机会和挑战。豌豆荚从「应用内搜索」向更多门类搜索扩展的过程中,用户的需求也更加多样化。同时在移动内容搜索领域,由于没有Hyper Link,缺少像Page rank这样的强有力的工具,也要求我们去寻找新的信号来帮助排序,所以我们在质量优化上花了更多的精力。不同门类内容的混排,举个例子,如果用户搜索「爸爸去哪儿」,我们首先要搞清楚用户是想找视频还是游戏,这就影响到我们把什么内容排在最前面。

  过去一年我们的搜索质量一直不断地提升。我们分享最近三个月的例子,最近三个月我们搜索质量的核心指标CTR点击率提升1.8%,这个数字对于搜索引擎的搜索质量是很不错的成绩。

  以上是这一年来豌豆荚在「应用内搜索」和搜索平台上的一些进展。这也是我个人参与豌豆荚以后参与的一系列工作。我过去八年一直在搜索引擎领域工作,我第一家公司是谷歌,后来加入云云网,是做社会化搜索的创业公司,最后来到了豌豆荚。就我个人来说,回顾过去一年在豌豆荚的工作经历,有两件事情让我非常骄傲:第一,我们团队花了4个月的时间搭建了一套业界一流的搜索引擎架构,第二,在这一年里我们的搜索质量一直不断提升。
   
  刘亚平:谢谢大海的分享,把技术的部分讲的我能够听懂,还是挺不容易的。以上回顾了我们过去在产品和技术上取得的进展。

  一年前我们已经开始在「应用内搜索」的尝试,过去一年我们不断用我们的产品实践,来实际检验我们自己的假设,我们的观点是否成立。一年过去了我们一条一条的看看,看看我们的假设是否成立,我们有没有发现什么新的东西。

  第一,我们最开始认为技术标准要开放。「应用内搜索」这个领域有很多家公司,每家公司都有自己的标准,谷歌的App Indexing,Quixey的AppURL和Facebook的Out app purchase等等,这都是有不同的标准,这些事情给开发者带来了很大困扰,开发者想接入不同的平台,这件事情其实是没有什么必要的。在豌豆荚3月份发布自己的「应用内搜索」协议的时候,我们坚定的认为我们不需要重复的发明文字,因为这些事情其实已经有了,我们用的是非常开放的技术标准,能够完全兼容主流的谷歌的App Indexing和AppURL的标准,对开发者来说这是非常友好的,因为只要开发一次就可以在各家服务上去接入。到现在我们也认为开放是整个互联网的基石,开放是最重要的。到今天我们这个想法也没有什么变化。

  第二,原生应用具有优势。Native App和Web App的讨论一直非常火。当然,用户消费内容的时候Native App是有优势的,就好像「猫眼」电影的例子,买一张电影票,你要选电影院、选座位、最后支付,整个过程很复杂,Native App能够支持复杂的交付,性能又非常好,这是很大优势。Native App也可以记住用户个人身份信息、用户偏好,这样体验更好,这一点到今天我们也相信是正确的。这一点也是在第三方报告中得到了一些印证。这是Flurry的报告,2013年和2014年用户在APP和Mobile web上花的时间对比,从2013年到2014年用户花在移动应用上的时间Mobile app上的时间从80%上涨到86%,花在web上的时间从20%下降到14%。这是用户用脚投票的结果,我们相信原生的APP还是具有体验上的优势,而豌豆荚「应用内搜索」技术在一开始的时候就非常好的支持原生App,没有自己网站的App也能够很方便的把自己的数据和内容提交给豌豆荚。

  第三,全面带来更好的发现体验。最初我们讲全面的时候都是讲网上视频搜索这样一个门类,来自不同门类的内容,最近我们发现来自不同门类的内容其实有更大的价值。开始我们做视频搜索的时候我们想法是做用户不应该也不需要记住哪个内容在哪个App里面。作为视频的重度用户我自己体验和感受特别深。比如说我可能看热门的韩剧,就只去爱奇艺,看「纸牌屋」这样的美剧就在搜狐,看自制剧就在优酷,看「我是歌手」这样的综艺节目,乐视是最强的。这件事情交给用户来说是非常困难的,有了豌豆荚的视频搜索之后,用户只需要在搜索框输入几个关键字就可以找到互联网上的所有视频,这是非常方便的。

  到今天,我们进一步发现,其实全面不只是针对一个门类的,跨品类的全面是更有潜力、更有价值的,这个感受很深。前一段时间国庆节放假,我去了日本,我在豌豆荚搜索了「日本」,我搜索的时候就想,为什么更多的内容不能在豌豆荚里直接看到呢?比如搜关于日本的视频、关于日本的音乐,甚至是旅游攻略,甚至是打折机票。这些内容都是「应用内搜索」能解决的范畴,这些信息,这些内容都来自于各个不同的App,这正是我们要解决的问题,所以我们做了跨品类的内容聚合,满足同一主题不同品类内容的需求。

  我们看一个例子。(例)在豌豆荚搜索“「日本」”,我们看到最传统的应用搜索的应用,「日本文化」、「酒店特价」的App,也有关于日本的视频,动画片「名侦探柯南」,日本的音乐。除此之外,还有来自「穷游」去日本旅行的锦囊,这对去日本旅行是非常有帮助的信息。还有来自「旅游攻略」这个App提供的美食信息。总体来说豌豆荚提供的是跨品类的搜索结果,这显然比单独搜索一个应用门类是更好的内容发现和体验。

  再举一个例子,比如我上班打车,可能经常在车上无聊想玩游戏,但是流量不是很够,所以主要玩单机游戏。在豌豆荚上搜索“单机游戏”,搜索出来有很多内容,这些游戏看起来很好玩。但问题来了,我自己有一个选择困难,这么多的到底玩儿哪个呢?从游戏描述上看起来都非常值得玩儿。豌豆荚也提供了一个答案,这是来自“「知乎」”的结果,「知乎」上的大牛做了一些游戏推荐。我们在用户决策消费的时候提供了非常有用的参考信息,这也是很好的内容发现的体验。

  以上两个例子我们可以看到,从各个品类、各个应用中索引这些信息,帮助用户更好地发现这些内容。整个过程、整个体验都比单品类更好。这是第三点发现全面。不光是一个品类内的全面,多个品类的全面,能够带来更好的发现体验。

  第四,用户在手机上消费内容,因为移动互联网天生是移动的,消费内容的场景也是更多种多样的。在豌豆荚做移动内容搜索,做「应用内搜索」技术的时候,我们想打通应用内的内容和用户之间的鸿沟,这是我们的初心想帮用户解决的问题。通过「应用内搜索」的技术,用户只需要搜索一个关键字就能够找到各种各样的应用里的内容。能给用户带来这样的便利,能帮助用户解决这样的问题,绝对不仅仅限于在豌豆荚里输入一个关键字来体验。其实有很多更方便,离用户更近的场景,把用户和内容之间的距离拉的更近。我请大家看一个很有想象力的例子,这个产品还在开发中,先给大家看一些图。

  这个故事的起源主要是上班路上打车的过程。我自己是急性子,每天用快的叫车,司机打电话过来跟说我大概多长时间到,接下来就让我等,等的过程中我会频繁的把手机解锁,看司机已经到了哪儿,有多久到?离我多远?这些信息本来也是快的提供的,是应用内的信息,也是我们可以做的一些事情。前一段时间我们有几个同事做了锁屏的产品,可以把手机的通知展示在锁屏上。我们可以把用户最需要的内容和信息展示在锁屏上,这样根本不需要解锁,不需要启动App就可以看到信息。甚至不只看到信息,甚至可以操作,可以打电话给司机,可以支付。这是非常方便的例子。不仅是用快的打车的例子,甚至可以在锁屏上直接查询北京天气指数,播放你在追的美剧,甚至回复微信消息,种种应用内的内容和信息都可以展示在锁屏上,离用户更近一些,这是对用户非常有帮助的。我们认为在用户使用这些内容,在移动互联网上消费和发现内容的时候,场景是非常多样的,我们找到这样的场景,把用户和内容之间的距离拉的更近。这就是我们过去一年在探索「应用内搜索」这件事情时候主要的一些发现。

  我们认为开放的技术标准是我们要坚持的,Native  App,原生应用还是具有体验优势。同时有一些更新的认知,比如原来我们提“全面”主要专注在提供一个品类内的全面,我们搜到所有视频网站上的视频,现在我们认为全面不仅仅是单一品类的,是跨品类的全面,也是对用户非常有价值的。我们发现用户消费内容的场景非常多样,我们可以在不同场景做不同的事情,把用户应用内的信息和内容都展现出来,给用户更大的帮助。这些都是过去一年我们探索中得到的心得,也是接下来我们在「应用内搜索」上继续探索的方向。

  过去一年我们很开心,最开心的是我们做了这么事情,有很多合作伙伴的支持,目前为止我们有50家合作伙伴和我们达成了合作,有更多的合作伙伴提供的内容和信息还在接入过程中。这些应用内的内容和信息是豌豆荚做「应用内搜索」最基础的事情。我们也有一些很骄傲的事情,刚才大海分享的我们在4个月的时间建立了业界一流的搜索引擎的基础架构,而且已经开始探索产品化的实践。另外我们也非常兴奋,从去年到今年这一年时间,已经有1.8亿用户在豌豆荚不只是找应用和游戏,通过豌豆荚发现了很多应用内的精彩内容,视频、壁纸、音乐、旅游锦囊、打折信息等,已经有1.8亿用户体验到很顺畅的应用内搜索体验。我们也觉得很踏实,过去一年「应用内搜索」我们有了进一步认知,我们发现自己坚持的很多事情,我们坚持开放的技术标准、使用原生应用给用户提供更好的体验,这些都是对的。我们也有更确定的方向,自己得到了新的认识,我们把全面走到更极致,不仅仅是同一个门类的全面,包括跨品类内容的全面,这对用户有更大的帮助。我们希望探索更多的使用场景,让用户在更多的使用场景下最方便、最快捷的找到他想要的内容信息。这是过去一年我们在「应用内搜索」上的探索和发现。
   
  主持人:其实我们分享了过去一年产品的进展,也看到了最近「知乎」、穷游以及还没有接进来的「快的」,是我们未来的方向。大海也讲了一些听起来我们蛮难懂的为什么把搜索做好的一些技术底层。这一年下来,一年前提的四个观点到现在为止到底还认为是不是对的?的确有一些当时的说法已经不那么正确,我们已经更新了我们的认识。其实今天很像我们内部的会议,向所有的豌豆汇报我们的工作进展。今天我们的目的、形式和内容就是这个。我们是和大家分享在「应用内搜索」这件事情,整个行业,豌豆荚是什么位置?我们是在很起点的位置,过去一年我们所做的事情仍然称之为尝试,也想跟大家说,我们到底认为哪些事情是对的,未来往什么方向去。和平时不一样的是不仅讲我们看到的方向是什么,更重要是讲我们作出这样判断的理由。

分享

加入收藏

网友评论 0条评论
用其他账号登录:
请稍后,数据加载中...
查看全部0条评论 >
潮机范儿

Copyright © 2007 - 北京沃德斯玛特网络科技有限责任公司.All rights reserved 发邮件给我们
京ICP证-070681号 京ICP备09081256号 京公网安备 11010502036320号