The Website for Computational Construction Grammar

 
 
전산 구문문법 연구

내용소개

 

디지털혁명에 힘입어 이제 언어학 연구도 경험주의 전통에 서 있는 코퍼스언어학이 주류를 이룬 지 오래다. 연구대상이 되는 언어자료의 단순한 디지털화를 넘어 자료에 언어학적인 정보를 부착한 코퍼스의 이용이 가능하게 됨으로써, 이전에는 언어학적인 문제로 인식하지 않았던 과제들을 지금은 적은 노력으로 해결할 수 있다. 이러한 유형에 속하는 과제중의 하나가 통계적인 시각에서 언어현상들에 대한 새로운 인식에 이르는 것이다.
전산 구문문법은 구구조문법, 코퍼스언어학 및 통계기반 연구방법론을 통합한 언어연구 패러다임이다. 이 연구서에서는 전산 구문문법에 의거하여 독일어 통사구조와 연관되는 새로운 사실들을 발견하고자 하였다. 기반이 되는 연구자료는 구문정보가 부착된 독일어 코퍼스 TIGER 2.1로서 그 규모는 888,238개 어휘이다. 검색도구를 이용하여 코퍼스로부터 여러 구문들을 추출한 후에 이 구문들과 관련된 통계적 사실들을 끌어내고, 여기에 해석을 담아 보고한 것이 구체적인 연구성과에 속한다.
이 연구서 저술의 바탕이 된 연구는 2008년 한국연구재단 인문저술 사업의 지원을 받아 수행되었다.

 

목 차

 

제1장 전산 구문문법의 이해

제2장 독일어 구문분석 코퍼스의 형식문법

제3장 동사의 결합가 및 연어관계(Kollokationen)

제4장 명사구의 구조

제5장 어순(Wortstellung)

제6장 수동구문, 재귀구문과 lassen sich 구문

제7장 부정사 구문, sein+zu-부정사 구문과 haben+zu-부정사 구

제8장 es-구문

제9장 접속법 구문

제10장 등위접속 구문

제11장 사역구문과 결과구문

제12장 전장(Vorfeld)의 통사론

제13장 외치(Extraposition)구문

제14장 코퍼스 TrivLit 21의 구축 및 활용

제15장 두 코퍼스의 비교

제16장 종합

 

부록

참고문헌

부 록

        

      1. 코퍼스 TIGER 2.1 구구조규칙 통계

      2. 코퍼스 TIGER 2.1 동사 Lemma 통계

      3. NN + zu-부정사 구문의 NN 통계

      4. R for Windows script를 이용한 로그 가능도 비율 산출과정

      5. 수동구문 동사의 의미영역

      6. 부정사구 주절 동사 목록

      7. 부정사구와 주절동사간의 공연강도

      8. sein+zu-부정사구문과 동사간의 공연강도

      9. 허사-es 구문 동사 목록

      10. 자리지킴어-es 구문 동사 목록

      11. 접속법 1식 구문 동사 목록

      12. 접속법 1식 구문을 목적절로 취하는 주절 동사 목록

      13. 부사 등위접속 관용구 목록

      14. 비대칭 구구조 규칙

      15. lassen 구문 동사 목록

      16. 전장에 나타나는 부사 목록

      17. da(r)Prep 구문 동사 목록

      18. 종속구문과 상관관계를 이루는 da(r)-Prep

      19. 코퍼스 TrivLit 21의 파일 내용 일부

      20. 코퍼스 TrivLit 21의 Lemma 통계

      21. 코퍼스 TrivLit 21의 동사 Lemma 통계

 

 

특별 부록 [웹사이트 데이터 공개]

 

 

S1. 수동구문 동사의 공연강도

S2. 재귀구문 동사의 공연강도

 

TIGERSearch 설치 및 실행방법

 

1. 다음 사이트에 접속한다:
http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERSearch/download/
2. Windows용 프로그램 설치파일 tssetup_v2.1.1_win.exe(58MB)을 다운받는다.
3. 위 설치파일을 더블클릭한다.
4. 설치과정에서 프로그램 폴더(디렉토리)를 c:\TIGERSearch로 지정한다.
5. 설치가 완료된 후에 폴더 c:\TIGERSearch를 연다.
6. http://www.smart21.kr/corpora로부터 파일 uTiger.zip 을 다운받는다.(바로 아래에 있음)
7. 압축파일 uTiger.zip를 c:\TIGERSearch의 하위폴더 \TIGERCorpora안에 넣고 압축을 푼다.
8. 프로그램 TIGERSearch를 실행한다.
9. 메뉴 상단 왼편의 Open selected corpus item을 클릭하여 uTIGER를 선택한다.
10. 패널 우측 화면에 Textal Mode 아래에 [lemma=/.*ung/ & pos="NN"] 이라고 입력한다.
11. Textal Mode 바로 위 메뉴판의 실행기호 ' > '를 클릭한다.
12. 위 단계 10.과 11.을 다음 예들을 가지고도 실행해 본다.
[word="Abend" & pos="NN"]
[word=/Ma.*/ & pos= ("NN"|"NE")]
[cat="NP"] > [pos="ART"]
(#n1:[cat="NP"] >* [pos="ART"]) & (#n1 > [pos="NN"])

 



  • 1000 문장 구문분석 코퍼스 [uTiger.zip] 다운받기