在一个txt文档中有2000w行数据,数据的格式如下
行尸走肉_mother
金蝉脱壳_smile
霸王别姬_love
逍遥法外_eternity
.......
八仙过海_destiny
请问如何快速检索出成语或者英文单词,麻烦请给我算法,谢谢大牛们
多奥淘宝客程序免费版拥有淘宝客站点的基本功能,手动更新少,管理简单等优点,适合刚接触网站的淘客们,或者是兼职做淘客们。同样拥有VIP版的模板引擎技 术、强大的文件缓存机制,但没有VIP版的伪原创跟自定义URL等多项创新的搜索引擎优化技术,除此之外也是一款高效的API数据系统实现无人值守全自动 化运行的淘宝客网站程序。4月3日淘宝联盟重新开放淘宝API申请,新用户也可使用了
回复内容:
在一个txt文档中有2000w行数据,数据的格式如下
行尸走肉_mother
金蝉脱壳_smile
霸王别姬_love
逍遥法外_eternity
.......
八仙过海_destiny
请问如何快速检索出成语或者英文单词,麻烦请给我算法,谢谢大牛们
你的目的到底是要确定某个成语/英文存在不存在还是要计算这个成语/单词出现的次数?
我以为不论什么方法,最大的可能性就是把全文都要过一遍。如果你这个检索的频率很高,这2000万个数据放到内存中再索引存储下会最快,如果只运行一次,那么最快的时间就是把文件都读一遍的时间(计算出现次数)。
搭一个 solr,创建索引,这样搜索效率提升很大









