The Website for German Language Of Websites (GLOW)


Marquis Who's Who Biographee

 

정보기반 독어학 연구




책 내용 소개

 

디지털 정보를 독어학 연구에 효율적으로 활용하는 방안을 마련하고 이를 널리 알리기 위해 본 학술서를 기획하게 되었다. 오늘날 디지털 정보는 웹(web)이나 인터넷상에 공개되어 있어 누구든 접근이 가능한 언어자료나 언어처리 도구를 지칭하는 것으로 이 언어자료들은 언어학적인 정보가 부착되어 있을 수도 있고 단순히 텍스트 정보에 지나지 않을 수도 있다.
코퍼스를 활용하여 언어연구를 수행하는 방법론이 더 세분화되면서 자신의 연구주제에 적합한 자작(自作) 코퍼스를 연구자 스스로가 구축하여 연구를 진행하는 연구자들도 점점 늘어나는 추세에 있다. 코퍼스를 구축한 당사자에게 유용한 ‘자작코퍼스’는 언어연구뿐만 아니라 언어교육에도 활용될 수 있다.
본 학술서의 일차적인 내용은 독어학자와 독일어 강의 담당자에게 여러모로 유용한 ‘자작코퍼스’의 구축 방법론에 대해 논의할 뿐만 아니라, 손수 구축한 자작코퍼스로부터 사용자가 연구에 필요한 데이터를 효율적으로 추출해 낼 수 있는 검색시스템 및 검색언어에 대해 상세하게 풀이하고 정리하는 작업이다. 본 저술의 이차적인 내용은 이미 구축된 코퍼스를 활용하여 주제연구를 수행하는 방안들에 대한 논의이다. 여기서 다루는 주제는 독일어 동사와 명사를 중심으로 한 연어관계(Kollokation)와 동사, 명사 및 형용사의 다의성(Polysemie)이다.

 

목 차

차 례


제1장 서론∙11

제2장 CWB와 자작코퍼스의 구축∙15

제3장 CQP 검색언어의 이해∙37

제4장 자작코퍼스의 활용방안∙79

제5장 연어관계의 유형론 및 접근방법∙153

제6장 동사중심의 연어관계∙161

제7장 명사중심의 연어관계∙193

제8장 부사중심의 연어관계∙215

제9장 다의성의 유형론 및 접근방법∙239

제10장 동사의 다의성∙255

제11장 명사의 다의성∙295

제12장 형용사의 다의성∙327

제13장 범주에 따른 다의성의 특성 비교∙351

제14장 종합∙357


부 록

저자 소개


이민행(李民行)

           leemh at yonsei.ac.kr

          http://www.smart21.kr/

• 독일 뮌헨대학교 대학원 졸업 (1991), 언어학박사

- 전공: 독어독문학부내 이론언어학, 부전공: 독어학, 논리학

• 하버드 대학교 초청, 하버드-옌칭 연구소 방문학자 (2002-2003)

• 국립 제주대학교 독어독문과 조교수 (1992-1995)

• 연세대학교 문과대학 독어독문학과 조교수, 부교수, 정교수 (1995-현재)

• 문화관광부 지원 국어정보화 아카데미 조직위원장 역임(제1회, 제2회, 제7회)

• 한국언어학회 부회장 역임(2006-2008, 2014-2016)

• 한국독어학회 『독어학』편집위원장 (2010-2012, 2014-현재)


■ 연구분야

• 의미론, 전산언어학, 코퍼스언어학, 기계번역, 광고언어학


■ 주요저서

• 『독어학 연구방법론-인문학적 발견의 변증법』(도서출판 역락, 2005)

• 『전산 통사•의미론-이론과 응용』(도서출판 역락, 2005)

• 『독일어 전산 구문문법 연구』(도서출판 역락, 2012)

• 『빅데이터 시대의 언어연구 - 내 손안의 검색엔진』(21세기 북스, 2015)

• 『심리동사의 의미론』(공저자: 이익환, 도서출판 역락, 2005)

• 『언어, 매체 그리고 권력』(6인 공저, 연세대 대학출판문화원, 2015)


CWB의 설치과정

 

1. 아래에 제공된 [CWB 설치파일]을 다운받는다.
2. 압축파일을 적당한 폴더에 넣어두고 압축을 푼다.
3. Active Perl을 설치한다. (파일 ActivePerl.msi를 더블클릭함으로써 설치를 시작한다.)
4. R for windows 2.8.0을 설치한다. (파일 R-2.8.0.exe를 더블클릭함으로써 설치를 시작한다.)
5. RTools를 설치한다.(파일 Rtools28.exe를 더블클릭함으로써 설치를 시작한다.)
6. Less를 설치한다.(파일 less-394.exe를 더블클릭함으로써 설치를 시작한다.)
7. 폴더 cwb를 c:에 복사한다.
8. Path를 설정한다.
(Windows 7/8을 기준으로 상세한 절차를 설명하기로 한다.)

8.1 제어판을 클릭한다.
8.2 “시스템 및 보안”을 선택해서 클릭한다.
8.3 오른편 화면의 “시스템”을 클릭
8.4 왼편 메뉴의 "고급 시스템 설정" 클릭
8.5 우측 하단의 "환경변수"를 클릭
8.6 “시스템 변수(S) 영역에 위치한 Path를 선택하여 블록을 지정한 후에 하단의 "편집"을 누른다.
8.7 하단“시스템 변수(s)” 창에서 “편집”을 선택한 후에 “변수 값(V)”의 가장 뒤쪽에 ;C:\CWB\bin; 를 추가한다.
8.8 하단의 “확인” 키를 눌러 “환경 변수(N)” 영역에서 벗어난다.
8.9 다시 하단의 “확인” 키를 눌러 “고급” 영역에서 벗어난다.
8.10 다시 “확인” 키를 눌러 “시스템” 영역에서 벗어난다.

*** Cwb 오픈소스 웹사이트는http://cwb.sourceforge.net/download.php 이다. 아래에 제공된 [CWB 설치파일]은 이 사이트에서 받은 것이다.

[CWB 설치파일] 다운받기


검색엔진 CQP를 실행하는 방법

1. 첨부한 스크린샷과 같이 도스창에서 cqp -e -r registry라는 명령을 실행한다.
2. 어휘빈도를 추출하는 검색을 연습한다.
3. 특정한 파생어 목록을 추출하기 위해 정규표현식을 이용한 검색을 실행한다.



새로 인코딩한 코퍼스를 CWB 시스템에 추가하는 절차

1. 인코딩된 코퍼스는 데이터베이스 폴더 하나와 등록파일 하나로 구성된다.
2. 데이터베이스 폴더는 폴더 cwb\corpora 안에 추가한다.
3. 등록파일은 폴더 cwb\copora\registry 안에 추가한다.
3-1. REG으로 시작하는 이름을 가진 파일이 바로 등록파일이다.
3-2. 이 파일을 폴더 cwb\corpora\registry 안에 추가한 다음에,
도스의 ‘이름 바꾸기’ 명령을 써서 파일의 이름으로부터 접두사 REG을 삭제하고 나머지는 그대로 둔다.

코퍼스 GLOW 다운받기

코퍼스 EU-DE 다운받기

코퍼스 EU-EN 다운받기




Perl-스크립트 목록

스크립트명

기능

연관 장

trans2MT.pl

테이블 포맷의 빈도데이터를 행렬 포맷으로 변환함

제4장

classID.pl

개별 레마에 의미부류를 할당함

제4장-제12장

getStatistics.pl

개별 레마를 대상으로 누적빈도와 누적백분율을 산출함

제4장-제12장

ccgRelRel.pl

두 개의 빈도파일을 입력으로 하여 통합빈도 파일 하나를 출력함

제4장-제12장



부록 확장 자료

파일명

자료명

V300-polysemyPattern.pdf

동사 300개의 의미확장 유형

N300-polysemyPattern.pdf

명사 300개의 의미확장 유형

A300-polysemyPattern.pdf

형용사 300개의 의미확장 유형



TreeTaggerU8의 설치과정

 

1. 아래에 제공된 [TreeTaggerU8 설치파일]을 하드디스크 C:로 다운받는다.
2. 다운받은 위치에서 압축파일을 푼다.

2.1 압축파일의 이름위에 마우스를 놓고 오른쪽 버튼을 누룬다.
2.2 “TreeTaggerU8\압축풀기”를 선택한다.

3. 새로운 파일에 대해 프로그램을 실행할 때에는 파일을 먼저 C:\TreeTaggerU8\bin 폴더안으로 옮긴 다음에 UTF8로 인코딩한다.
4. 폴더안의 파일 how2runTreeTaggerU8.jpg에 정리된 실행방법에 따라 새로운 파일을 태깅하거나 청킹한다.
*** 트리태거 웹사이트는 http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ 이다. 인용시에는 이 사이트를 언급해야 한다.

 


[TreeTaggerU8 설치파일] 다운받기



@ 부록에 수록된 데이터

• 저작권 관련하여 출판사의 요청에 따라 [부록에 수록된 데이터]는 공개하는 대신에 저자 이메일(..... at yonsei.ac.kr)로 요청을 하면 보내드립니다.
• 메일제목을 "정보기반 독어학 연구 / 부록 데이터 요청"으로 하여 메일을 보내주시기 바랍니다.



Exchange Rates Widget