探討順序
- Syntatic rules
- Two word stages
- Sentence modalities
- Preschoolers (anaphora)
設計會讓小孩說出relative clause的實驗。elictation technique (p172 大象和人跑步的圖片)
4 types of sentences (4 characteristics. Gap這邊的意思是蓋掉了. 2x2 , 即是[R,C] x [S,O] )
- Right-branching
- Center-branching (Embedded)
- subject-gap relative clause (easier for childrem): The walrus [that is tickling the zebra]. (who’s tickling?)
- object-gap relative clause (missing an object, harder for children): The horse [that the boy rode] (rode what?)
RS: I know the girl who is rad-headed.
RO: I know the girl whom John is in love with.
CS: The girl who is read-headed is Scarlet.
CO: The girl whom I saw is read-headed.
難度:RS<RO=CS<CO
CHILDES corpus
- cite 來源必須符合CHILDES的規範以及語料來源的規範(類似Linux 的 GPL 規範系統)
- 中文(只有台師大和北京華語的、方言有台語Taiwanese和Cantonese)
- .cha檔案要用CLAN這個軟體開,但也可以用Notepad更改副檔名以後當成.txt來開…
- 手冊 http://childes.psy.cmu.edu
- 比CHILDES等級更高的Talkbank http://talkbank.org
- 有dependent tier(s) 的時候必須把前面的對話也留下一些,才有進入的參考點
- %cod 是用來標記自己需要的coding 記號,運算時可以找到自己標注的記號和出現次數
- ||通常表para-linguistics 表示同時發言或發出笑聲
CLAN frequently used commands (hit ctrl+d to give commands,記得指令打完了才能選file in輸入檔案)
CLAN 說明書 http://childes.psy.cmu.edu/manuals/clan.pdf
- check
- freq
- mlu
- mlt (mean length of turn)
- kwal (keyword search)
- freq+t*CHI (type-token ratio: a measure of lexical diversity. 用來看類似字作同樣用途的比例.這是只算對話中child的某個tier的freqency)
- freq + t*CHI + z50u (前50句的)
- freq + t*CHI + %cod (child小孩說的某個tier裡面再加上有標記cod的次數,是交集)
- freq + t*CHI + s”but” (交集,抓”but”這個字的用法,可以附上更多+s來限定。用來找對特定「字」或用語的出現場景和現象)
- combo (交集搜尋)
- combo + t*CHI + s”what^is” (^表示把what 和 is 這兩個字連在一起的結果列出來)
- combo + t*CHI + s”kitty^kitty”
- combo + t*CHI + s”what^*^is” ( 那個*表示這個位置可以是任何東西沒關係)
TCCM(下星期的線上corpus)
本週作業:
- 自己找個課本上或任何有興趣的東西或topics(比如MLU,或是什麼),拿到CHILDES上去找語料,並用CLAN去作點什麼分析。然後跟大家分享你的結果和心得
- Progress report 11/25, 不到一個月了,自己看看這學期想做什麼題目。
Yoyo長城,分隔筆記和我的感想
Abula
那堆NMV是要幹嘛的
留言
張貼留言
Please leave your comments. I will read them in mailbox and reply.