经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 数据库/运维 » Windows » 查看文章
中文维基百科获取与处理流程
来源:cnblogs  作者:原来我是猕猴桃啊  时间:2019/10/31 8:50:04  对本文有异议

一、获取

http://dumps.wikimedia.org/    

enwiki(英文)zhwiki(中文)

指导文档:

https://www.cs.bgu.ac.il/~elhadad/nlp12/jwpl/wikification.html

二、处理

参考:https://dkpro.github.io/dkpro-jwpl/HowToGetJWPL/

Cmd问题不太好解决(主要是看不懂改不了) 选择了eclipse

配置问题包括:

Jdk 环境设置(系统及eclipse)

Vm环境设置(eclips.ini)https://dkpro.github.io/dkpro-jwpl/DeveloperSetup/

数据结构设置(文件位置)

 

仔细阅读官方文档  各文件位置也很重要

 

 

 

他在运行。。。。。

等待ing(3小时吧)

结束

 

 

三、创建相应的数据库

 

1创建数据库命令(数据库名DB_NAME可以自行设定):注意要保证创建的数据库的编码是utf-8

CREATE DATABASE WIKI2019 DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;

 

 后面按大家的来,没什么问题不写了

参考(感谢):

https://www.cnblogs.com/CherishFX/p/5280259.html

https://blog.csdn.net/qq_39023569/article/details/88556301

 

 

原文链接:http://www.cnblogs.com/ann-1012/p/11764497.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号