谷歌Autonomy微软等角逐企业级搜索金矿
在互联网的发展中,是Google结束了以Yahoo、AOL为代表的门户阶段,把互联网和全球网民带入到了搜索时代。
“搜索”这个词,是伴随着Google的发展而为大众所知的。在互联网的发展中,是Google结束了以Yahoo、AOL为代表的门户阶段,把互联网和全球网民带入到了搜索时代。我们对搜索的理解半径几乎是由Google的工程师们划定的,这就是面向个人的互联网搜索服务。在这个范围内,Google极大地丰富和完善了互联网搜索的服务内容和服务质量,公司也创造的快速发展的神话。目前股票市值已经超过微软,成为新经济时代新的霸主。它的成功,这进一步强化了人们对搜索的传统认识,那就是在Google所提供服务的范围之内。
但按Google定义的传统的“关键词”搜索的模式,及面向个人用户的搜索服务,经过这些年的飞速发展,这个领域的服务和市场已经接近扩张的边缘。于是,Autonomy、Google、Yahoo、微软的等国际巨头,一起把未来竞争目标所定在企业级搜索市场上,企业级搜索市场也迅速扩大。但尽管这么多有影响的公司进入,由于企业级搜索的技术门槛较高,并没有出现个人搜索市场上那种群雄争霸、烽烟四期的局面,百度去年甚至还退出了企业搜索市场。
当前企业信息管理的难题所在
相对Google、Yahoo等主要面向互联网个人用户的服务而言,企业级搜索,主要面向企业级的高端用户,满足企业生产经营中需要的企业内外的各种介质、格式的信息,进行挖掘、处理、应用等服务。企业用户对信息的需求不仅仅限于简单的查询结果,而是结合搜索、数据库查询、语义和句法分析、分类和聚类、相关性分析等技术,整合现有的信息资源,提炼出具有商业价值或社会价值的数据支持。
从企业的日常经营活动来说,进入信息网络时代后,世界变得平坦了,企业的情报和信息收集处理工作已经成为几乎每个人都要进行的工作。使用Google、baidu在互联网上为企业搜集信息,已经成为公司职员们很重要的日常工作。
互联网上的信息,尽管我们个人常常觉得达到了几乎无所不有的程度,但数字表明,企业发布到互联网上的信息只占信息量的1%-2%,而98%以上的信息是存储在企业内部的。对于个人而言,互联网的海量信息,似乎可以让我们无所不知,但对于企业来讲,目前互联网上的信息是远远不够的。
单就企业内部而言,据调查显示,企业内部数据在以每年200%的速度增长。这些数据中,除了20%的数据是以数据库的形式存储外,其它的80%是均是网页、各种格式的文件、邮件和图片等非结构化的形式,它们散落在企业内计算机系统中的各个角落。统计显示,企业网络里超过80%的信息是非结构化的信息,80%里面不到10%的内容是在网页里找到的。其它80%的内容可以是几百种文件格式中的一种格式,不同的应用程序和储存库,使用不同语言,受不同级别的安全模式保护。这些数据总量远远超过了互联网上信息的总量,而这些信息靠常规的搜索引擎是没法搜索到的。企业80%的员工平均每天在不同的应用上搜索必需的信息,都要浪费30分钟的时间。
这些80%的数据之间只有很少部分是建立了关联关系的,可以从一个数据找到另一个数据。绝大多数是没有任何链接关系的。很多企业以前一直以数据库方式管理企业的各类经营信息,但随着海量数据的增加、文件格式类型的多样化,数据收集、处理、检索工作的日常化,传统的、以把数据进行结构化为原理的数据库管理方式已经远远不能满足企业的需要。海量的信息的涌现,要使企业的数据达到数据库要求,而需要完成的标引工作,变成了没法完成任务;另外信息的各类格式和类型的多样化,如视频、音频、邮件、不同语言的文档、不同格式的图片等等,如果这些内容全部进行数据库管理,也将使数据库的建立变得难以承受的庞杂。
另据统计,当今,80%企业信息未能系统地应用到业务过程里面。指望员工花费很多时间去为可能有用的文档进行分类或贴标签是不切实际的。必须有一种新的信息管理方式,可以管理、检索、整合与其专业领域相关的大量的公司数据。这种新的信息管理方式,与传统的以个人用户为主的搜索引擎、文档管理工具或数据库查询工具不同,它不仅需要能访问数据,而是要将各种内容和格式的数据替人管理起来,以最方便的形式供人们使用。
企业级搜索并不是个人搜索引擎的升级版
企业存在的上述问题,代表着庞大的企业级市场需求,很早就引起了技术先进的国际巨头的注意。来自英国剑桥的Autonomy公司、Google、微软等纷纷进入这个可以预见的、互联网领域的下一个金矿。基于目前的技术发展成就和未来的发展前景,这些公司不约而同地走上了打造一个可以满足企业生产经营需要的、专门的企业级搜索平台道路上来。
- 本文关键词:

