终于找到了一份比较完整的,分享一下。
---------
海量数据处理:十道面试题与十个海量数据处理方法总结
作者:July、youwang、yanxionglu。
时间:二零一一年三月二十六日
说明:本文分为俩部分,第一部分为10道海量数据处理的面试题,第二部分为10个海量数据处理的方法总结。有任何问题,欢迎交流、指正。
出处:http://blog.csdn.net/v_JULY_v。
------------------------------------------
第一部分、十道海量数据处理面试题
1、海量日志数据,提取出某日访问百度次数最多的那个IP。
首先是这一天,并...
MapReduce, 分布式, 并行, 海量数据, 面试阅读全文
我接触MapReduce时间不长,属于初学者的级别,本没有资格在这里谈“MapReduce与自然语言处理”的,不过这两天刚好看了IBM developerWorks上的《用 MapReduce 解决与云计算相关的 Big Data 问题》, 觉得这篇文章有两大好处:第一,它有意或无意的给了读者不仅有价值而且有脉络的关于MapReduce的参考资料;第二,虽然文中没有直接谈“自然语言处 理”,但是在最后的“下一步”引申中,它给关注MapReduce在文本处理的读者列出了一份与自然语言处理相关的参考资料,这些资料,相当的有价值。因 此对于“MapReduce或者并行算...
MapReduce, NLP, 自然语言处理阅读全文



最新评论
唉,又是看不懂的。
太明智了,工作以后,想出去玩
神马时候有空去五莲山玩玩 :
我们班前段时间也是去的泰山。
:grin: :grin:
哥哥毕业也是去的泰山 不过
我想问问 这个spider的
高安唱的一生无悔 ,你听听
:?: 看不懂英文啊 。。。
师兄你好,我也是山大软件学院