欢迎大家来到IT世界,在知识的湖畔探索吧!
程序员写道 “假设你有一个很大的数据集,非常非常大,以至于不能全部存入内存。这个数据集中有重复的数据,你想找出有多少重复的数据,但数据并没有排序,由于数据量太大所以排序是不切实际的。你如何来估计数据集中含有多少无重复的数据呢?这在许多应用中是很有用的,比如数据库中的计划查询:最好的查询计划不仅仅取决于总共有多少数据,它也取决于它含有多少无重复的数据。如何解决?且看 Nick Johnson 的这篇讲解基数估计算法的文章(译文)。 “
我每天只吃四类食物:早饭、午饭、晚饭和零食。–加菲猫
本站提到的所有注册商标属于他们各自的所有人所有,评论属于其发表者所有,其余内容版权属于 solidot.org(2009-
北京市公安局海淀分局备案号:
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/105316.html