| 課程名稱: | 自然語言處理導論 | 課程討論區 ( 最新貼:2010-6-16 9:21:04 ) | 
| 任課教師: | 詹衛東 * 劉揚王厚峰常寶寶** | * 北京大學中文系** 北京大學信息科學技術學院 | 
| 電子郵件: | zwd@pku.edu.cn (詹卫东) | liuyang@pku.edu.cn(劉揚) | 
| 辦公電話: | 62765810 | 62765835-205(分機) | 
| 
有關本課程的任何問題和建議,都歡迎與我們聯繫 | ||
2011-2012學年第二學期上課時間:2012年2月13日~6月8日(週一 5~6節地點:二教206)考試時間:
教學參考資料
史蒂芬鳥,伊万·克萊因和愛德華·洛珀。2009年與Python自然語言處理。O'Reilly Media出版。
克里斯托弗D.萬寧和辛里奇SCHUTZE的的。1999年統計自然語言處理的基礎。麻省理工學院出版社。
丹尼爾Jurafsky和詹姆斯·馬丁。2000年語音和語言處理。培生教育。
課程進度安排                 
| 序號 | 內容提要 | 講義 | 參考資料 | 
| 第1週 
2012年2月13日 | 課程概述:課程安排, 參考文獻說明, 等等. 
緒論:什麼是自然語言處理? | 課程安排 | 问答系统:Eliza,IBM Watson,…… 
機器翻譯系統:Google,WorldLingo,…… 
自然語言處理的支撐科學是什麼?(Author:Shuly Wintner) 
漫話人工智能 (顧森) | 
| 第2週 
2012年2月20日 | 
理論基礎: 
中文文本的自動分詞 | 第02章 | 漢語自動分詞研究述評 | 
| 第3週 
2012.2.27 | 理論基礎: 
詞性標註方法 | Chapter_03 | 楊孝華二卷 | 
| 第4週 
2012年3月5日 | 理論基礎: 
漢語的句法結構分析(上) | Chapter_04(I) 
簡單句法分析方法示例 (自底向上,自頂向下,左角分析法) | 歐萊的分析算法 | 
| 第5週 
2012.3.12 | 理論基礎: 
漢語的句法結構分析(下) | chapter_04(II) | 句法結構歧義的程度 | 
| 第6週 
2012.3.19 | 理論基礎: 
語義分析 | Chapter_05 | |
| 第7週2012.3.26 | 
理論基礎: 
語篇分析(王厚峰) | Chapter_06 | |
| 第8週 
2012.4.2 | 
討論課(第一次大作業) 
作業要求: 
>>> 第一次作業提交情況記錄(2012.4.27) | 
 | |
| 第9週 
2012年4月9日 | 工程實踐: 
Python及NLTK包的應用—— 訪問語言資源 | 教材下載:NLP與Python 
要求:熟悉教材第1章第1、2、3、4節;熟悉教材第2章第2、3節,了解第1、4節。 | 蟒蛇-2.5.4 | 
| 第10週 
2012年4月16日 | 工程實踐: 
Python及NLTK包的應用—— 文本處理基礎 | Chapter_08 
要求:熟悉教材第3章第1、2、8、9節,了解第3、4、5、6、7節。 | |
| 第11週 
2012年4月23日 | 工程實踐: 
Python及NLTK包的應用—— 程序設計進階 | Chapter_09 
要求:熟悉教材第4章1、2、3、4節,了解第5、6節。 | |
| 第12週 
2012.4.30 | 工程實踐: 
Python及NLTK包的應用—— 分詞和詞性標註 | Chapter_10 
要求:熟悉教材第5章第1、2、3節,了解第4、5節。 | |
| 第13週 
2012.5.7 | 工程實踐: 
Python及NLTK包的應用—— 句法分析實現 | Chapter_11 
要求:了解教材第8章第1、2、3、4節。[特別說明,期末考試第8章第1、2、3、4節不作要求] | |
| 第14週 
2012年5月14日 | 工程實踐: 
Python及NLTK包的應用—— 信息抽取 | Chapter_12 
要求:熟悉教材第7章第1、2、3、4、5、6節。 | |
| 第15週 
2012.5.21 | 工程實踐: 
Python及NLTK包的應用—— 文本分類 | Chapter_13 
要求:熟悉教材第6章第1、2、3節,了解第4、5、6節。[特別說明,期末考試第6章第4、5、6節不作要求] | |
| 第16週 
2012年5月28日 | 
機器翻譯(常寶寶) | ||
| 第17週 
2012年6月4日 | 討論課 (第二次大作業) 
漢語自動分詞與詞性標註 | 
 | |
| 
第18週 
2012.6.11  | 考試 |  | 
