大数据:初创企业的福音

作者:迈亚•帕尔默 来源:金融时报 发布时间:2013-2-13 11:35:59 点击数:
导读:克里斯托弗•阿尔伯格(ChristopherAhlberg)能够预测未来——或者,至少他希望自己的公司能做到这一点。RecordedFuture在互联网上四处搜罗信息——Twitter消息、新闻报道和博客内容——并进行快速分析,然后为公司…

克里斯托弗•阿尔伯格(Christopher Ahlberg)能够预测未来——或者,至少他希望自己的公司能做到这一点。Recorded Future在互联网上四处搜罗信息——Twitter消息、新闻报道和博客内容——并进行快速分析,然后为公司和政府提供最新情报。

阿尔伯格说:“我们的预测范围,包括从中国总理计划何时出访澳门到竞争对手公司打算推出什么产品的一切事情。”不出意外,这项服务引起了相当大的兴趣。“我们的客户包括关注世界大事的全球大型企业,从事政治风险交易的对冲基金,甚至包括政府机构,”他说。他不愿透露具体客户的名称,因为大多数客户不希望把自己使用此类信息收集服务的事实广而告之。Recorded Future的顾问包括前中情局(CIA)执行局长大卫•凯里(David Carey),谷歌(Google)和中情局的投资部门均为该公司提供资金支持。

Recorded Future成立于三年前,如今年营业额已达1000万美元,拥有35名雇员。以它为代表的一大批初创公司都把云计算和大数据作为业务模式的基础。Recorded Future的崛起象征着这一领域的成熟速度之快:如果将时光向前推移五年,很难想象它能生存下去。

电商集团亚马逊(Amazon)等公司提供即用即付(pay-as-you-go)模式的海量计算机处理能力和存储空间,使得小公司也能够计算大量数据。此前,如果要分析互联网上数以PB(1PB=1000TB——译注)计的数据——其信息量约相当于2000万个文件柜——需要购买几屋子的昂贵服务器。

凯里表示:“云计算降低了门槛,因为你可以借助云计算的力量。比如说,如果需要更大的计算能力,你只需要再添置一台服务器就够了。”

相关技术的迅速发展,还使得公司能够快速分析大量的非结构化数据,如社交媒体消息和图片。一些技术让更快地处理更多数据成为可能,例如可让公司轻松处理大量数据的Hadoop,以及由SAP开发、可减少计算机数据处理时间的Hana。

“能够利用更强的处理能力的确是一个因素,”阿尔伯格说,“但更有意思的是,我们现在可以实时追踪世界各地的信息源。与过去大不相同的是,如今我们能够抓取文本并将其转化为数据,不论它是中文字符还是西班牙文。”

技术市场研究公司Ovum分析师托尼•贝尔(Tony Baer)表示,迄今利用这些计算能力的主要是初创企业,更大、更成熟的企业依然动作缓慢。贝尔称,在近期的Ovum大会上,只有三分之一的与会公司正在实施大数据项目。“而且,大部分项目并不深入,大多还停留在概念验证(proof-of-concept)阶段。”

的确,目前试图开展大数据项目的公司通常只是谨慎行事。贝尔解释道,雅虎(Yahoo)和谷歌等互联网先锋企业是个例外,例如它们“通过搜索结果对广告投放进行优化。但大多数公司只是略微扩大了原有数据分析的规模。”

大数据让公司能够实施比以往精确得多的监测。今后再没有必要只根据小范围的数据样本进行推断了;现在已有可能做到分析整个数据集。贝尔回忆道,上世纪80年代,尼尔森(Nielsen)曾为部分美国家庭安装用以测量全国电视收视率的机顶盒,但样本大约仅占全部家庭的0.02%,数据也因为不够精确和不具有统计显著性而饱受诟病。贝尔称:“尼尔森必须科学地对待样本,还得让家庭在日志上记录看过的电视节目。现在你不需要让被调查者做什么,只要捕捉关于用户在网上或移动设备上所收看内容的数据即可。”

位于马萨诸塞州剑桥的Bluefin Labs,通过监测观众在社交媒体上的评论,构建观众所收看电视节目内容的实时动态。调查数据显示,约有40%的人使用智能手机或平板电脑观看电视节目,这一样本容量已经足够大。美国哥伦比亚广播公司(CBS)等公司使用这种办法来评估节目的受欢迎程度,消费者商品公司宝洁(P&G)则使用该技术评估广告的效果。

最终,大数据甚至可以为研究人员提供用户不会主动透露的细节。脱胎于麻省理工学院媒体实验室(MIT Media Lab)的初创企业Affectiva,使用网络摄像头监测人们的面部表情,该技术提供的数据可让公司了解观众在看到某一广告时的表情反应。

为多家大数据初创公司担任顾问的凯里称,大公司必须警惕被小公司超越,后者已经可以掌握更快、更精确的数据。

“曾几何时,公司对‘无数据决策’引以为豪,”他说,“他们对业务了解得极为透彻,因此可通过敏锐的直觉做出难以撼动的正确决策。但现在,新进入市场的公司可以借助提取出的种种数据,同样做出正确的决策。”

译者/徐天辰

 

上一篇:首届云计算法律问题全国学术研讨会 下一篇:安邦:迎接大数据时代