超酷算法:基数估计

超酷算法:基数估计程序员写道 假设你有一个很大的数据集 非常非常大 以至于不能全部存入内存 这个数据集中有重复的数据 你想找出有多少重复的数据 但数据并没有排序 由于数据量太大所以排序是不切实际的 你如何来估计数据集中含有多少无重复的数据呢

欢迎大家来到IT世界,在知识的湖畔探索吧!

程序员写道 “假设你有一个很大的数据集,非常非常大,以至于不能全部存入内存。这个数据集中有重复的数据,你想找出有多少重复的数据,但数据并没有排序,由于数据量太大所以排序是不切实际的。你如何来估计数据集中含有多少无重复的数据呢?这在许多应用中是很有用的,比如数据库中的计划查询:最好的查询计划不仅仅取决于总共有多少数据,它也取决于它含有多少无重复的数据。如何解决?且看 Nick Johnson 的这篇讲解基数估计算法的文章(译文)。 “

我每天只吃四类食物:早饭、午饭、晚饭和零食。–加菲猫

本站提到的所有注册商标属于他们各自的所有人所有,评论属于其发表者所有,其余内容版权属于 solidot.org(2009-

北京市公安局海淀分局备案号:

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/105316.html

(0)
上一篇 44分钟前
下一篇 22分钟前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们YX

mu99908888

在线咨询: 微信交谈

邮件:itzsgw@126.com

工作时间:时刻准备着!

关注微信