2007年度 名古屋大学 国際開発研究科 公開講座

コーパスを利用した言語研究のためのテキスト処理入門

−終了しました−


■1. 講座概要

開講の主旨・
講座内容:

最近,言語研究や言語教育にコーパス(電子化された言語資料)を利用するケースが増えていますが,コーパスから目的に合わせ適切にデータを抽出するには,処理対象となるコーパスの中身と処理過程の理解が不可欠です。専用ツールには簡単に使えすぐに結果が得られるものも多く便利ですが,利用者には見えないところで処理が行われるため,意図通りの処理がなされているのか考えずに使用してしまう危険性もあります。

このような背景を踏まえ,この講座では,テキストエディタ,正規表現,表計算ソフト,UNIXのテキスト処理ツールなどの汎用的なツール・技術を使ってデータを処理しながら,基礎的なテキスト処理技術を身に付けるとともに,情報抽出・加工の過程を段階ごとに確認しながら処理を進めることで,適切にデータ処理を行うセンスを養うことを目指します。

講座は,コンピュータ室での実習を中心に,講義も交え,4日間にわたり集中的に行います。

受講対象者:

本講座の主な対象は,言語研究・言語教育にコーパスを利用しようと考えている大学生,大学院生,研究者,教師です。日頃,コンピュータを使っている方を想定していますが,コンピュータに関する専門的な知識・技術は前提とはしません。

対象言語: 具体的な処理の例として使用するのは英語と日本語のテキストになりますが,どの言語のテキストを処理するうえでも基礎となる内容が中心となります。
担当講師: 大名力,杉浦正利(名古屋大学 大学院 国際開発研究科 国際コミュニケーション専攻
定員:18名
受講料:9,200円
開催期間: 2007年9月1日 (土) 〜 4日 (火)
(全24時間。日にちにより時間が異なります。)
会場: 名古屋大学 国際開発研究科棟 (愛知県名古屋市千種区不老町)

■2. お申し込み方法・お問い合わせ先

募集期間: 7月23日 (月) 〜7月27日 (金)
(先着順。空き数よりも多くの申し込みがあった時点で,同着分の中から空き数分抽選。)
申し込み方法: 募集要項にある「受講申込書」,「受講票・領収証書・領収証書(控)」に必要事項を記入の上,受講料及び返信用封筒を添え書留郵便でお申し込みください。詳しくは,募集要項をご覧ください。
要項の入手方法: 本サイトからPDF版をダウンロードし,ご使用ください。 印刷版が必要な方は,返信用封筒(80 円切手貼付)を同封の上,下記申し込み先までご請求ください。
申し込み先: 名古屋大学 大学院 国際開発研究科 事務室
 住所: 〒464-8601 名古屋市千種区不老町
 電話: 052-789-4952・4953 [9:00 a.m.〜5:00 p.m.]
 FAX: 052-789-4951
内容に関する:
問い合わせ先 
corpus2007@gsid.nagoya-u.ac.jp (担当: 大名 力)

■3. 日程および主な講義内容

時間 主な内容
1日目
9/1 (土)
5時間
12:00-17:00
  1. コンピュータの基礎知識[大名]
  2. 表計算ソフトによるテキスト処理[大名]
2日目
9/2 (日)
7時間
9:00-17:00
(昼休み1時間)
  1. 正規表現によるテキスト検索[大名]
  2. 文字コード[大名]
  3. テキストエディタによるテキストの検索・加工[大名]
3日目
9/3 (月)
7時間
9:00-17:00
(昼休み1時間)
  1. UNIX入門
  2. UNIXのテキスト処理ツールの利用[大名]
  3. 頻度の検定と共起関係の強さ[杉浦]
4日目
9/4 (火)
5時間
9:00-15:00
(昼休み1時間)
  1. リモートホストへのログインとファイルの転送[大名]
  2. 自然言語処理用プログラムの応用[大名]
  3. まとめ[大名・杉浦]
上記の時間帯には休憩の時間も含まれます。初日には昼休みの時間はありません。

2007/05/28 作成日
2012/08/23 最終更新日