-
>
心靈元氣社
-
>
縣中的孩子 中國縣域教育生態(tài)
-
>
(精)人類的明天(八品)
-
>
厭女(增訂本)
-
>
這樣學習才高效/楊慧琴
-
>
心理學經(jīng)典文叢:女性心理學
-
>
中國文化5000年
基于索引行聚類的英語動詞型式自動識別與提取研究 版權(quán)信息
- ISBN:9787513596596
- 條形碼:9787513596596 ; 978-7-5135-9659-6
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
基于索引行聚類的英語動詞型式自動識別與提取研究 本書特色
適讀人群 :學生,教師 **、二、六、七章
基于索引行聚類的英語動詞型式自動識別與提取研究 內(nèi)容簡介
《基于索引行聚類的英語動詞型式自動識別與提取研究》關(guān)注概括和提取語言型式。本書中采用相似度分析方法,在索引行自動聚類的基礎(chǔ)上實現(xiàn)英語動詞型式的自動識別與提取,圍繞索引行聚類的影響因素及分組數(shù)量的選擇,型式自動識別的準確率及其影響因素進行探究,建構(gòu)了英語動詞型式自動提取模型,該模型以后可能廣泛應用于語言教學、語言研究及自動語法檢查中。
基于索引行聚類的英語動詞型式自動識別與提取研究 目錄
緒論 1
0.1 研究背景 1
0.2 本研究的理論及實踐意義 4
0.2.1 理論意義 4
0.2.2 實踐意義 6
0.3 本研究概述 9
0.3.1 研究目的 9
0.3.2 研究問題及研究對象 9
0.3.3 研究步驟 10
0.3.3.1 語料及預處理 11
0.3.3.2 特征集的建立及其轉(zhuǎn)換 11
0.3.3.3 權(quán)重計算 13
0.3.3.4 索引行聚類 14
0.3.3.5 型式提取 15
0.4 本書結(jié)構(gòu) 15
0.5 小結(jié) 16
**章 型式與型式語法 17
1.1 型式 17
1.1.1 型式研究的緣起與發(fā)展 17
1.1.2 型式的定義 20
1.1.3 型式實例 21
1.1.4 型式元素及其編碼 23
1.1.5 本研究中判別型式的六個標準 26
1.2 型式語法 26
1.2.1 短語學思想與習語原則 27
1.2.2 詞匯與語法關(guān)系及各自地位 28
1.2.2.1 詞匯語法不可分 28
1.2.2.2 詞匯為中心的研究 30
1.2.3 型式與意義的關(guān)系 32
1.3 型式語法的優(yōu)缺點 35
1.3.1 型式語法與傳統(tǒng)語法的差異 35
1.3.2 型式語法的優(yōu)點 36
1.3.3 型式語法的不足 37
1.4 以型式語法為理論基礎(chǔ)的相關(guān)研究 40
1.5 小結(jié) 41
第二章 型式識別方法與相關(guān)應用研究 42
2.1 型式識別標準 42
2.2 型式總結(jié)的必要性 43
2.3 型式的識別 44
2.3.1 型式的人工識別 45
2.3.2 型式人工識別輔助工具的開發(fā) 48
2.3.3 型式的自動識別 48
2.3.3.1 型式自動識別的理據(jù) 48
2.3.3.2 型式的自動識別研究 51
2.4 現(xiàn)有的語言型式網(wǎng)絡(luò)平臺數(shù)據(jù)庫 52
2.4.1 基于機器處理的網(wǎng)絡(luò)數(shù)據(jù)庫 53
2.4.2 基于人工處理的網(wǎng)絡(luò)數(shù)據(jù)庫 54
2.5 小結(jié) 56
第三章 聚類分析 57
3.1 文本表示 58
3.2 特征選擇及其權(quán)重 59
3.2.1 特征選擇 59
3.2.2 權(quán)重計算 60
3.3 相似度計算 61
3.3.1 相似度計算的源起及理據(jù) 61
3.3.2 相似度計算方法 61
3.3.3 相似度分析在語言研究中的應用 63
3.4 聚類算法 64
3.4.1 劃分聚類 65
3.4.2 層次聚類 66
3.5 聚類質(zhì)量評價指標 67
3.6 聚類在本研究的應用理據(jù) 68
3.7 小結(jié) 69
第四章 文本預處理與特征集的建立及轉(zhuǎn)換 70
4.1 研究概述 70
4.2 語料選取 70
4.3 研究工具 72
4.3.1 語料預處理工具 72
4.3.2 自主開發(fā)的模塊及腳本 72
4.4 語料預處理流程 73
4.5 動詞型式中的必要元素及其轉(zhuǎn)換方法 75
4.5.1 型式列表中元素的總體特征 75
4.5.2 具體詞形的處理方法 77
4.5.2.1 右側(cè)搭配詞處理方法 77
4.5.2.2 左側(cè)搭配詞處理方法 90
4.5.2.3 兩側(cè)搭配詞處理方法 90
4.5.3 相鄰單詞組合的處理方法 90
4.5.4 詞類標簽及語義類標簽的轉(zhuǎn)換方法 98
4.5.4.1 詞類標簽的轉(zhuǎn)換方法 98
4.5.4.2 語義類標簽轉(zhuǎn)換方法 102
4.5.5 轉(zhuǎn)換順序及步驟 104
4.6 小結(jié) 105
第五章 索引行聚類及型式自動提取方法 106
5.1 特征表示方法、特征權(quán)重與位置權(quán)重的計算 106
5.1.1 特征及特征權(quán)重 106
5.1.1.1 功能詞處理方法 107
5.1.1.2 特征標記方法 107
5.1.1.3 型式邊界的界定 108
5.1.1.4 索引行跨距的設(shè)定 110
5.1.1.5 特征權(quán)重計算方法 112
5.1.2 位置權(quán)重 112
5.1.3 特征—索引行矩陣的生成 113
5.2 聚類算法 114
5.2.1 相似度計算 114
5.2.2 K均值算法 115
5.2.2.1 K均值聚類 115
5.2.2.2 K值的選擇標準 115
5.3 型式自動提取 116
5.4 小結(jié) 117
基于索引行聚類的英語動詞型式自動識別與提取研究 作者簡介
于濤,文學博士,江蘇師范大學外國語學院副教授,副院長,碩士生導師。研究方向為:應用語言學與語料庫語言學。曾主持江蘇省社科基金項目一項(已結(jié)題),現(xiàn)主持國家社科基金項目 "基于型式語法及索引行聚類的動詞型式自動識別與提取研究"一項。迄今發(fā)表論文數(shù)十篇。
- >
隨園食單
- >
苦雨齋序跋文-周作人自編集
- >
羅庸西南聯(lián)大授課錄
- >
二體千字文
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學概述
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
羅曼·羅蘭讀書隨筆-精裝
- >
唐代進士錄