MongoDB删除重复数据

作者 : 开心源码 本文共437个字,预计阅读时间需要2分钟 发布时间: 2022-05-13 共218人阅读

使用MongoDB存储爬取到信息,但是因为考虑不周,没有对重复的数据进行去重后才插入数据库,导致有很多重复的数据,需要根据唯一性的id字段删除MongoDB里面的重复数据。

步骤如下:

①导出JSON格式数据
mongoexport -d database_name -c collection_name -o filename.json

其中:
database_name:数据库名
collection_name:集合名
filename.json:保存的json文件名

②删除旧集合
db.collection_name.remove({})
③新建索引
db.collection_name.create_index({"jobId":1}, {"unique":true})

其中:
{"jobId":1}:索引字段,1:升序,-1:降序
{"unique":true}:索引能否唯一

④导入数据
mongoimport -d database_name -c collection_name filename.json
说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » MongoDB删除重复数据

发表回复