微软购买火热的创业公司powerset有何计划?这个3岁的公司由巴尼 佩尔博士创办,并于最近启动了针对维基百科的语义搜索体验。
人们怀疑微软买下这个公司不是仅为加强其搜索业务的。很可能是复制维基百科解决方案,把powerset插入浏览器中,在这篇博客里我们看一下这起并购背后的故事。
开始的大多数评论认为powerset产品发布并没有给人留下深刻印象。评论家欣赏有创新性的语义用户界面也认识到其潜力,但认为它不会在很大程度上改善维基百科。所以从冷淡的评论来看,被微软收购出于意料。10亿的价格标签大约是将5倍于A系列的12亿再加8亿的投资投给公司。微软执行层一定坚信powerset是与google战斗的武器。
今天的powerset是什么
给定一组非结构化的信息,powerset应用自然语言加工技术从正本中提取概念和关键语义概念,然后建立语义索引(和google的类似)及实体之间的关系概念图。此图通常是用RDF三倍数表示的。
powerset创新之一是语义表面化于用户界面。载入语境插件帮助用户浏览非结构化信息。
许多人认为powerset是一个普通的语义搜索引擎,但它的首款产品就限于wikipedia,将该技术大范围应用到整个web世界,价值就很高了。
为什么powerset很强大
几年前语义技术出现的时候,人们开始谈论语义网站或是语义搜索怎么样成为google的杀手。因为语义搜索可以传递更多相关的结果,因为它“知道”内容。
业内认为不是那么回事,语义搜索与google使用的统计方法相比没有特别大的优势。在博客 Semantic Search - Myth and Reality中有相关讨论。
powerset最厉害的是什么呢?正是它不尝试将网页作为一个整体来搜索。现在,这一解决方法在wikipedia成功了,但基础构架是通用的,所以也可以应用到其他网站以增强效果。成熟的语境概要可以用来搜索任何内容。
不处理整个网页,这一方法在针对具体的网站时可能会被首先考虑。
对google的正面消息是什么?
今天的powerset不是google杀手。从这点上说,只有巨大的动力才会有机会。
在搜索市场,google占有率很大——潜力更大,如果雅虎的交易完成。人们对google很有信心:简单,是,不完美,但已足够好了,搜索结果要好于live搜索。
如果微软买了powerset,并把它和live 搜索整合,可能会是另一个在底线上的没什么影响的收购。事实上,在live搜索blog上的宣布也是如此。排在首位的收购原因是获取人才;第二个是相信NLP 和语义算法能填补当今搜索的漏洞。
powerset带来的仅仅是有意思的技术;没有带来动力,那微软是怎么想的?可能会有更微妙的发挥,因为已经有杠杆作用的事实:powerset在像wikipedia这样的知识网站运行的不错。
可能微软打算将powerset应用在它自己的网站上,将powerset整合在ie浏览器里。
设想浏览wikipedia ,每个页面都有语义,现在通过网页周围的主要信息源来提高这一体验。
提供语境,语义体验使得微软能让人们停留的时间更长些,除去他们花费在google搜索上的时间。
这是很重要的一点,因为google没能在搜索上挣钱,它是靠广告盈利的。
在广告业微软能打过google吗?
微软寻求解决的真正问题是广告。直到现在,网站已明确了广告的两个基础-门户和搜索。
门户在每个页面显示广告;刷新内容的人们越多,显示的广告也越多,网站盈利也就越多。搜索模式作为另一个选择出现,现在更成功,成为获取广告收入的一条路。
利用powerset和其他语义技术,又出现另一种模式:覆盖在现有的内容上的语境信息探索。
如果微软能够把人们从google的主页面引开,游戏就会发生重大的改变。浏览器是微软最厉害的工具之一——其默认页是live 搜索。
微软想赢取广告商,就要用浏览器做更多的工作。把powerset的语义搜索器整合到浏览器并设为默认将会改变游戏。这不是简单的。一个有官僚作风和执行问题的大公司是不可能迅速、完美的将语义融合到浏览器中的。
结论
兼并powerset是微软引人关注的行为。这家炙手可热的语义创业公司被很多公司盯上了。
计划是怎样的?微软买下这家公司不会仅仅为加强live 搜索。很可能的计划是复制wikipedia的解决方法,然后把powerset合并在ie浏览器上。
这是个很大胆的游戏,要求严格执行——并不是后来微软所表现出来的那样。