地址:

您现在的位置 : 产品中心

产品中心

天眼云客旗下无忧秘书平台发布2020版全局内容搜索引擎系统

  天眼云客旗下无忧秘书平台发布2020版全局内容搜索引擎系统,随着平台的发展,平台及入驻企业的内容越来越丰富,为了方便用户快速检索到需要的内容,搜索效果的好坏在交易和O2O场景中直接决定着GMV的转化。通常该场景下,数据的更新极快,包括文章和商品的描述、价格等,这些变化需要实时更新到索引中,需要在多维度相互比较,比如按价格、按销量、按浏览量、关键词等进行比较,方便用户做多层次的挑选。用户对商品偏好个性化十足,为了提升效果,需要收集丰富的行为数据设计千人千面的搜索算法。

  无忧秘书全局内容搜索引擎系统基于天眼云客自主研发的大规模分布式搜索引擎平台,该平台承载了无忧秘书全部主要搜索业务。以平台服务化的形式,将专业搜索技术简单化、低门槛化和低成本化,让搜索引擎技术不再成为业务瓶颈,以低成本实现产品搜索功能并快速迭代。为平台以及入驻平台的企业,提供简单、高效、稳定、低成本和可扩展的搜索解决方案。

  无忧秘书全局内容搜索引擎系统的模块包括:基础搜索、前缀相关词列表、相关词列表。

  基础搜索:使用基于Apache Lucene的Elasticsearch作为搜索底层技术栈,配合IK分词和拼音分词,做到同义词、停止词的配置。使用Vert.x作为服务中台,进行了WebServer的封装,以Rustfull API的形式提供服务;

  前缀相关词:搜索的行为关键字、时间、来源服务等信息会被Elasticsearch记录下来,而前缀词则是从海量记录中按照频率最高排序匹配的结果;

  相关词列表:相关词的来源则是根据用户所搜结果进行协同过滤的结果,即搜索了此关键词的人也喜欢搜索的关键词(使用的是ScallyDB + Spark Streaming + Spark MLlib协同过滤,实时计算并将数据回写到 Elasticsearch)。