热门文档
- 2023-10-13 17:09:40 楚辞 中华传统诗词经典 可复制-李山-9787101097528
- 2023-04-19 15:04:26 《千家妙方 上册 1982年》(李文亮等编)
- 2022-09-18 20:22:00 中国人为什么看不起中国人 张鸣
- 2022-09-18 20:22:00 中国兵法之起源 编委会
- 2023-10-13 17:09:40 超速学习:我这样做,一个月学会素描,一年学会四种语言,完成MIT四年课程-斯科特·扬著,林慈敏译-9789861755533
- 2022-11-24 16:17:09 《性体验与性爱心理》尤里-谢尔巴特赫
- 2022-11-24 16:17:09 《性爱健康指南》石四维编著
- 2023-10-13 17:09:40 初中诗词格律读本 可复制-周建忠 徐乃为 王业强编著-9787101121704
- 2023-10-13 17:09:40 曾国藩家书 中华经典藏书(升级版)可复制-檀作文译注-9787101115482
- 2023-10-13 17:09:40 菜根谭 中华经典藏书(升级版)可复制-杨春俏译注-9787101115611
- 2022-09-18 19:48:57 心理催眠术 迈克尔.赫普,温迪.德雷顿著
- 2023-10-13 17:09:40 崇祯帝大传-晁中辰著 可复制-9787101114935
1、本文档共计 443 页,下载后文档不带www.pdfdz.com水印,支持完整阅读内容。
2、古籍基本都为PDF扫描版,所以文档不支持编辑功能,即不支持文档内文字的复制粘贴。
3、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
4、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
5、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、古籍基本都为PDF扫描版,所以文档不支持编辑功能,即不支持文档内文字的复制粘贴。
3、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
4、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
5、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
内 容 简 介自然语言处理技术已经深入我们的日常生活。我们经常用到的搜索引擎就用到了自然语言理解等自然语言处理技术。自然语言处理是一门交叉学科,涉及计算机、数学、语言学等领域的知识。
本书详细介绍中文和英文自然语言处理的原理,并以Java 实现,包括中文分词、词性标注、依存句法分析等。其中详细介绍了中文分词和词性标注的过程及相关算法,如隐马尔可夫模型等。在自然语言处理的应用领域主要介绍了信息抽取、自动文摘、文本分类等领域的基本理论和实现过程,此外还有问答系统、语音识别等目前应用非常广泛的领域。在问答系统的介绍中,本书特地介绍了聊天机器人的实现过程,从句子理解、句法分析、同义词提取等方面揭示聊天机器人的实现原理。
本书详细介绍自然语言处理的各个领域,既有理论,也有实现过程。对于打算从事自然语言处理研究的计算机、数学或语言学领域的专业人士,本书是难得的入门教材。
前言
目前,互联网上的信息迅速膨胀,要想从中找出需要的信息就需要使用搜索引擎,你是否知道搜索引擎的工作原理它到底如何对诸如汉语这样的文字进行加工、然后反馈出需要的结果?像这样的语言处理问题都会在本书中找到答案。即使在计算机专业,也有很多人对这个学科很陌生。因此,本书借助流行的Java语言介绍自然语言处理的各个领域,希望为推动相关应用的发展做出贡献。
本书的编者在自然语言处理教学和软件开发过程中积累的经验融入到本书的各个环节,读者会因此感到原理和实际应用结合得非常紧密。编者的实践经验还体现在相关的其他书中,如《自己动手写搜索引擎》《自己动手写网络爬虫》《自己动手写网络爬虫》《使用C#开发搜索引擎》《解密搜索引擎技术实战》等。
有一些自然语言处理的开发原理与技巧在专业的公司内部秘而不宜。理论与实践结合的专门讲自然语言处理的书籍仍然相对较少。本书尝试先介绍原理,接着是具体的代码实现分析。本书相关的代码在读者QQ群(499526946)中的共享文件中可以找到。
国外有的基础课程从“构建搜索引擎”开始介绍计算机科学。我们的相关培训课程已经这样做了。当年参加过培训的学员,有些已经创业成功或者成为公司的技术骨干。要根据培训经验写出很好的自学教程,我们还有很多工作要做。零基础自学的读者,可能还需要其他方式来补足。
自然语言处理开发岗位比较少。如果能够花若干年开写出自己的软件产品,那么就可以合自然语言处理原理与技术实现
伙创业了。这个过程对很多人来说,往往太漫长。像老外那样把冰箱放满匹萨饼和可乐,然后就开始干活,这样往往行不通,因为那样吃不了几天。可以买好能够保存几十年的谷子、水培可以吃若干年的韭菜。
就好像放在水里的韭菜种子,刚开始几天根本看不到变化,学习是个循序渐进的过程。可以在读者群中共同学习。
感谢开源软件和我们的家人,关心我们的老师和朋友们、创业伙伴,以及选择猎兔自然语言处理软件的客户多年来的支持。
特别提醒大家经常面对电脑,容易阻塞气血。往往并没有免费的程序员保健师帮忙,所以需要自己多压腿,拉伸身体。多做腹部运动,减少腹部脂肪堆积,避免脂肪肝等疾病。此外,还可以拍打身体,例如腋下、臂弯、胭窝等关节凹下去的地方。
长时间对着散发蓝光的电脑屏幕容易失眠。为了提高睡眠质量,可以经常吃小米、藕、虾皮、鸡蛋等,喝决明子、玉兰花、熏衣草、绞股蓝等花草茶。