2005年度 国際開発研究科 公開講座

大規模コーパスと英語研究
─テキスト処理ツールを使ってコーパスの中身を見る─

Bコース 詳細情報

最終更新日: 2005/07/17


■1. プログラム全体構成


午前の部 午後の部
コーパス概論 正規表現によるテキスト検索
A. サーチエンジンによるウェブ検索 テキストエディタ・表計算ソフトによる検索・加工
B. Perlによるプログラミング入門 1: 1行スクリプトからKWIC表示まで

A. BNCwebによる検索実習およびBNC/ANC概論 公開講演会
B.
Perlによるプログラミング入門 2:
 語彙頻度表の作成
A. 英語語法文法1 英語語法文法2 まとめ
B. PerlによるCGIプログラミング入門

■2. Bコース講義内容

担当:大名 力 (おおな つとむ)

処理対象は英語 (ASCII) のテキストです。ASCII 以外のテキストの処理については本講座では扱いません。
7月31日 「Perlによるプログラミング入門 1: 1行スクリプトからKWIC表示まで」

プログラミング言語 Perl を使って,基本的なテキスト処理の方法を学びます。Windows 環境で Perl を使う方法を学んだ後,簡単な1行スクリプトから始めて,正規表現による検索・KWIC 表示までを扱います。(時間的に余裕があれば,リスト・配列についても触れます。)

初日午後に学ぶ正規表現を利用すると,複雑な条件を指定した検索ができ,さらに,適当な形式に加工して出力することが可能になります。

8月1日 「Perlによるプログラミング入門 2: 語彙頻度表の作成」

Perl によるプログラミング入門の続きです。配列・ハッシュ・サブルーチンについて学び,ソート機能付き KWIC プログラム,単語の頻度表を出力するプログラムを作成します。

「入門 1」で学ぶこと以外,予備知識は必要ありませんが,プログラミングは初めてと言う人には,時間が短いこともあり,難しいかもしれません。「PerlによるCGIプログラミング入門」を受講しようという方には必須の内容です。

8月2日 「PerlによるCGIプログラミング入門」

Perl を使って CGI プログラミングの基礎を学びます。(参考:「CGI プログラムの例」) モジュールの使い方,CGI の基本的な仕組みの理解から始め,KWIC プログラムをウェブ上で利用できるようにします。

注意:一般公開されたサーバー上で CGI プログラムを稼働させるにはセキュリティへの配慮が欠かせませんが,本講座では,セキュリティ関係のことは扱いません。実際に扱うプログラムは,基本的な仕組みが理解しやすいように,単純化されており,セキュリティのことは考慮されていません。本講座を受講しただけでは,公開されたサーバー上で稼働可能な CGI プログラムを作成することはできませんので,この点,予めご承知おきください。
Bコース テキスト 目次
Perl によるプログラミング入門 1: 1行スクリプトから KWIC 表示まで
Lesson 11行スクリプト,コマンドライン・オプション,特殊変数 ($_, $., $ARGV)
Lesson 2データの読み込み,スクリプトファイルの書き方,特殊変数 ($/, $&, $' など)
Lesson 3文字列の加工
Lesson 4ファイルへの入出力
Perl によるプログラミング入門 2: 語彙頻度表の作成
Lesson 5リスト,配列,for
Lesson 6配列の並べ替え
Lesson 7サブルーチン
Lesson 8ハッシュ
Perl による CGI プログラミング入門
Lesson 9ライブラリ,モジュールの利用
Lesson 10CGI プログラムの起動方法とウェブブラウザーへの出力
Lesson 11ウェブブラウザーからのデータの取得
Lesson 12データの保存

一部内容が変更される可能性があります。

使用するテキストは,下記 URL のテキストの一部を,今回の環境に合わせて書き直したものになります。

Perl によるテキスト処理入門 [一部アクセス制限あり]
http://infosys.gsid.nagoya-u.ac.jp/~ohna/perl_lesson/


■3. 受講の条件等


[1] Perlによるプログラミング入門 1 [2] Perlによるプログラミング入門 2 [3] PerlによるCGIプログラミング入門
前提知識 Windows の基礎知識,基本的な操作能力*は必要だが,プログラミング,Perl に関しては特別な知識は必要としない。 [1] [1] [2] および HTML に関する基礎知識。(テキストエディタで簡単な HTML 文書が作成できる程度の知識は必要。)
その他の条件 なし。 なし。 ウェブサーバーとPerlがインストールされたコンピューターを持参できること。
環境 大学のコンピューター (Windows XP/2000) を使用。
自分で Perl がインストールされたコンピューターを持ち込んで使用することも可。その場合,OSは何でもよいが,動作および操作方法に関しては自己責任となる。
基本的に自由だが,全て自己責任。但し,次の環境に関しては,一部サポート有り。**
  • Windows/ActivePerl/AN httpd
  • Mac OS X

* 次のページに書かれている程度のことは前提となります。(随時,更新していますので,ご注意ください。)

Windowsの基礎知識: ドライブ,パス,ディレクトリ,拡張子,ワイルドカード

上記ページの内容については,初日の講座終了後,希望者を対象に講習を行う予定です。

** 希望者には,2日目の講座終了後,設定方法等について説明しますが,指定の環境であっても自己責任となりますので,できるだけ事前に動作確認を行って参加するよう,お願いいたします。

ウェブサーバーの機能がよくわからないうちは,ネットワークに接続された状態でウェブサーバーを起動するのは止めましょう。


■4. セッションの組み合わせ

条件を満たせば,Bコースのセッションのうち,一つまたは二つだけを受講することが可能ですが,望ましい取り方は,[1], [1][2], [1][2][3] になります。

◆組み合わせ例 1


午前の部 午後の部
1
コーパス概論 正規表現によるテキスト検索
2 B. [1] Perlによるプログラミング入門 1
3 A. BNCweb による検索実習および BNC/ANC 概論
4
A. 英語語法文法1 英語語法文法2 まとめ

Perl によるプログラミングの初歩を学びたいという人向きです。「入門 1」の内容だけでも,正規表現を利用することにより,複雑な検索・加工が可能になります。

◆組み合わせ例 2


午前の部 午後の部
1
コーパス概論 正規表現によるテキスト検索
2 B. [1] Perlによるプログラミング入門 1
3 B. [2] Perlによるプログラミング入門 2
4
A. 英語語法文法1 英語語法文法2 まとめ

Perl によるプログラミングの基礎を学びたいが,CGI プログラムの作成までは必要としないという人向きです。

◆組み合わせ例 3


午前の部 午後の部
1
コーパス概論 正規表現によるテキスト検索
2 B. [1] Perlによるプログラミング入門 1
3 B. [2] Perlによるプログラミング入門 2
4 B. [3] PerlによるCGIプログラミング入門 まとめ

Perl によるプログラミングと,CGI プログラムについて学びたいという人向きです。

Perl によるプログラミングに詳しい方であれば,[1][2] を受講せずに [3] のみを受講することも可能ですが,そのような方であれば,[3] はテキストを見れば受講せずともわかるでしょうから,Aコースに参加されることをお勧めします。


名古屋大学大学院国際開発研究科
国際コミュニケーション専攻
大名 力 (Tsutomu OHNA)
2005/07/17