ソフトウェアのダウンロードとインストール

野村の講義や演習において必要とされる主なソフトウェアやコーパスのダウンロードとインストール(セットアップ)の方法,および初期設定の一部を簡単に解説しておきます。講義と演習の活動の範囲では,フリーウェアまたはフリーライセンスで充分です。以下に挙げるもののうち,秀丸と KWIC Finder のライセンス仕様(演習では不要)以外はフリーです。目的に応じてダウンロードしてください。
OSやブラウザによって違いがあったり,うまく作動しないばあいがあったりするかもしれません。慣れた人に直接聞きながら実行することをおすすめします。Internet Explorerによってダウンロードするのが無難だと思われます。アンインストールの方法は各マニュアル等を参照してください。
最初にダウンロードしたインストールファイルは,展開し,インストールが完了した後は削除してください。

インストールがうまくいかなかったり,インストール後にアプリケーションがうまく作動しないときは,システムを再起動すると正常になることがあります。

秀丸:秀まるおのホームページのソフトウェアのページで「秀丸エディタ」を選択して,該当するファイルをダウンロード,セットアップ用のファイルを通常はデスクトップに保存,これを実行して,通常はCドライブのプログラムファイルのフォルダにインストール。シェアウェア(2017年4月現在4,000円+税)なので,送金しライセンスキーを入力する必要あり。印刷には秀丸パブリッシャーを連携させると便利。関連するメーラーとして秀丸メールがある。
初期設定は,「その他」→「ファイルタイプ別の設定」でフォント,「体裁」で折り返し方や折り返し字数を設定。その他の設定は,ヘルプを参照。

折り返しは固定で80文字程度,「詳細」で「行番号の計算方法」は「エディタ的」として改行単位でカウントするようにしておく。
Windows10では,「折り返し文字数」とウィンドウの上部に表示されているカーソルの桁とがずれることががある。日本語を扱うのであれば,文字数は40字程度が無難なので,実際の折り返しの文字数を数えて設定する必要がある。

サクラエディタ :サクラエディタのフロントページからインストーラパッケージダウンロードのページに入り,最新版をダウンロードする。方法は上記の秀丸とほぼ同じ。ただし,インストールの過程で通常は「QuickLaunchアイコン作成」「起動時に常駐」のチェックを外しておく。
初期設定は,「設定」→「タイプ別設定」の「スクリーン」で折り返し方などを設定,「折り返し桁数」は,80または81にすると,日本語は1行が40字で表示されるはず。「ウィンドウ」で「行番号の表示」は「改行単位」としておく。「フォント設定」なども,見やすいように設定する。
その他の設定は,ヘルプを参照。
[なお上のリンクから入るサイトではセキュリティソフトとの関係でうまくダウンロードできないことがあるらしい。そのときはサクラエディタの左下にある英語のサイトからのダウンロードを試みる。それでもうまくいかないばあいは,ここにリンクしてあるサイトからダウンロードを試みる。]

Mery:「MeryWiki」,または「Vector」「窓の杜」のページからダウンロードする。
初期設定では,オプションとして文字数やフォントを指定,指定文字数で折り返しとして行番号を表示させておく。「ツール」から「オプション」を開き,「基本」で「文字数」を80または81など,「表示」の「フォント」でフォントサイズを見やすいように設定する。
一般に grep と称するコマンドは,このエディタでは「ファイルから検索(置換)」が該当する。これを起動させると「ファイルの種類」を指定するようになっていて,ここには,たとえば個別のファイル名と拡張子を指定したり,フォルダ内すべてのファイルを対象にするなら「*.txt」のようにワイルドカードと拡張子を指定したりする必要がある。

K2Editor:K2 Software's Page のフロントページで 「K2Editor」を選択,lzhのファイルをデスクトップに保存,解凍ソフトで解凍,通常はCドライブのプログラムファイルのフォルダにインストール。 Vista 以降への対応は保証されていないが,作動するようである。ただしサポートが定期的には実施されていないようなので,新しいOSでの作動は不明。

エディタの行数表示は,秀丸では「表示→行番号」,Meryでは,「表示→行番号」,K2Editor では「その他→ファイルタイプ別の設定→外観→垂直ルーラ(行番号表示)」にチェック。サクラエディタでは,自動的に表示されるので,「タイプ別設定→ウィンドウ」の「改行単位」を指定しておく。
box(矩形)選択は,通常のモードでは,Alt か Ctrl キーを押しながらマウスで選択。または,適当なキーにコマンドを割り当てる。

KWIC Finder:EBシリーズ・サポート・ページのKWIC Finderのページ,または Vectorのサイト内で,該当するファイルをダウンロード,セットアップ用のファイルを通常はデスクトップに保存,セットアップウィザードを開始,通常はCドライブのプログラムファイルのフォルダにインストール。テキスト検索のみのばあいは,フリーライセンスで良い。テキスト以外の種類のファイルを検索するのであれば,ライセンスキー(有料)が必要。Windows10でも正常に作動する。
【Kwic Finderは,2018年11月に "Kwic Finder 4" のリリースが行われ,無条件でシェアウェアとなり,フリーライセンスの属性がなくなった。】
インストールしたら,通常の使用においては,初期設定に対して「検索文字列」を「部分」とし,「サイズ」「同義語」のチェックを外す,「設定→オプション →リスト」の「タブ区切りデータの形式」の「バイト位置」「直前語」のチェックを外しておく。
KWICの左側文字列数は,「設定→オプション→スタイル」で,そのときに着目したい部分に応じて任意に設定する。その他の設定は,ヘルプを参照。
文字書式は「表示」から指定できる。パソコンの環境にもよるが,JSゴシックが比較的見やすいようである。
検索するとき,フォルダツリーにチェックを入れたり,ファイル名を指定したりする。また,ファイルの種類をプルダウンして指定しておく。フリーライセンスなら, [*.txt,・・・]または[*.*], [*.txt]を指定する。これを指定しないと検索が作動しない。
正規表現は常に有効にしておく。その他,詳細はヘルプを参照。たとえば「表示→検索結果ソート順」などをうまく活用すると,現象がよく理解できることがある。

KH Coder:KH Coderのサイトのトップページの記述を参照,これに従ってダウンロードしインストール。OS が Vista のばあい,起動しなかったり障害が生じる可能性がある。その時は,同サイトの「よくある質問(FAQ)」を参照。Mac OSXやLinuxのばあいは,マニュアルを参照。Excel 用アドインも登録する。Excel のバージョンが古いと,うまく連繋しない可能性がある。

Elan:Elan または MPI のサイトから該当する最新のバージョンのファイル,およびマニュアル類をダウンロードし,インストール。Windows,Mac OSX,Linuxすべて準備されている。インストールまでは容易に進むはず。実際の運用には若干のスキルが求められ,システムの全体像が複雑なので,マニュアル類を丁寧に参照する必要がある。動画・音声ファイル処理のためのツールも適宜インストールしておく。方法のページに示した日本語による関連サイトも,参照することが望ましい。一般的な記述の範囲であれば,紹介した日本語の関連サイトを参照するだけでも充分だと思われる。
各ウィンドの表示は日本語で記述されていて,注釈の書き込みも日本語で実行できる。日本語の使用に関してトラブルが生じることがあるようだが,通常の注釈を記入するだけであれば,特に大きな問題はなさそうである。

青空文庫:青空文庫のサイト内にある青空文庫早わかり,およびファイルのダウンロード方法・解凍方法を参照。XP 以降,Zip ファイルはダブルクリックで開くので,解凍ソフト不要。
テキストファイルにある「《 》」で囲まれたルビを一括して削除するためには,エディタの正規表現を有効にして「《[^》]+》」または「《.+?》」を空白で置換する。同様に「[ ]」で囲まれた注記を削除するためには,「[[^]]+]」または「[.+?]」を空白で置換する。「 」内の記述をそのままコピーして空白で置換すれば,ルビや注記を削除したプレーンテキストを得ることができる。
テキストファイルをワープロ文書ファイルにコピーしたばあい,一太郎では,正規表現を有効にして「《[^》]+》」を空白で置換する。Wordでは,オプションで[ワイルドカードを使用する]を有効にしておいて「《*》」を空白で置換する。

XHTMLファイルは,エディタやメモ帳にコピーすれば,ルビは削除される。

新潮文庫:新潮文庫の CD-ROM をテキストファイルに変換するツールとして,ジャック川崎氏のテキスト読み出しツール(Vector内)がある。各ファイル(隠しファイル)別にコマンドプロンプト(MS-DOS)で処理するので,若干のスキルと時間が必要。著作権等に留意して使用すること。「新潮文庫の100冊」はEXB2T,「大正の文豪,明治の文豪,絶版100冊」はEBK2Tで処理する。

解凍ソフト:Vector ・窓の杜などから適切なソフト(解凍ソフトLhasa,圧縮・解凍ソフト+Lhacaなど)を選択してダウンロード,セットアップ用のファイルをデスクトップに保存,セットアップウィザードを開始,デフォルトのCドライブ,またはデスクトップにインストール。デスクトップ以外にインストールするときは,ショートカットをデスクトップに作成する(Lhasaではインストール時にチェックを確認,+Lhacaではショートカットも自動で作成されるはずなので操作不要)。野村の講義や演習の範囲では,圧縮機能不要。

各ソフトウェアの使用は,マニュアルやヘルプを参照して行って下さい。特に自動的に分析・解析結果が表示されるシステムは,結果の読み取りを慎重に行って下さい。統計学(多変量解析)や心理学等の基礎訓練を受けていない人は,それらの結果を無視して下さい。杜撰な前処理や意味の分からないままのデータ解読は,失敗を招くだけです。

コーパス付属の検索システムについては,解説しません。また,文学作品を対象としたコーパスには誤植が含まれている可能性がありますから,注意して下さい。信頼のできる紙媒体による確認が必要です。談話資料では,誤植の存否は一般に判断できません。

OSX関係のソフトウェアとして,エディタでは mi ,コンコーダンサでは Simple KWIC Lister (『日本研究センター教育研究年報』第1号(2012)からリンク)がある。筆者はこれらの使用環境にないので,注記するにとどめる。
miの初期設定は,「設定」の「モードごとの設定」のウィンドで,サイズを14ポイント,折り返し文字数を80字あたりに設定すると見やすいだろう。
mi,Simple KWIC Lister ともに,正規表現が使用できる。

HOME
(HOMEをクリックすると新たにトップページが現れます。)