欢迎光临
我们一直在努力

《基于R语言的自动数据收集》/网络抓取 和文本挖掘指南

《基于R语言的自动数据收集》/网络抓取 和文本挖掘指南

内容简介:

本书共17章。第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识。这一部分内容涉及互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等),并讲解用于查询网络文档和数据集的基本技术(XPath和正则表达式)。第9~11章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工作流程、真实环境数据中的陷阱以及规避它们的方法等问题提供一些实用的见解。

下载地址:

此站大部分下载链接失效了,以后只在新的网站更新维护。新的电子书网址:https://www.boyanglee.com/home/search.html

[ARFormslite id=100]
赞(0) 打赏
免责声明:本站所有资源来源于互联网,仅供个人学习交流,网站本身不存储任何相关资源文件,如资源下载链接侵犯到版权方,请发送邮件到1401211620@qq.com,站长核实后会第一时间移除,谢谢!
请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
分享到: 更多 (0)

宝阳读书小站-mobi+epub+azw3+pdf电子书免费下载

联系我们关于我们

收集不易,觉得内容对你有帮助,可以打赏资助下站长

非常感谢你的打赏

支付宝扫一扫打赏

微信扫一扫打赏