報技術進步L℃、九∽℃寸℃の問题苏自動的仁解决才石力付℃仕 v。自動要钓c住尔<分析上、与办6仁仕、必然的仁分析者D判断冬二仁 住含ま九石。一圭)、分析者独自の判断中切口上2大古)上、客櫬性上信 心上)性上密雨立吉世石大的仁休、东九5办D工夫水求的6机百D下杨可。 1.2.2本稿0研究了プ口一于 以上D上)众問题点密踏夫之℃、本研究c仕、KH Coder上八)yフ卜ヴ工 了在用(、收集L大記事化OV℃質的研究在行)。以下c仗、KH Coder主 在機能及心之机左亿本研究生办寸D小忆O℃、脱明L℃<。 a.KH Coder D主在機能 内容分析0研究花踏主之℃、テ牛入卜マ人二>少上↓、)新大标凳想茶提出这 机大。机住、口>飞ュ一夕一左使2℃デ一夕)中D言葉在抽出L、分析寸石 方法℃杨石。飞机仕苍6仁二OD分析了ブ口一于仁分竹石。飞九老礼 Correlational了プ口-于Dictionary-based了ブ口-チc。 Correlational了ブ口一于仕テ牛入卜デ-夕办6自動的忙取)出L大言葉花 使2℃、力ラ入夕一分析D上5在多变量解析花行5了プ口一手c态石。一方、 Dictionary--based了プ口一于仗分析者方自身D判断亿基℃デ-夕力6取 )出L大概念东L力テ子刂一在使2℃分析在行)了才口一于℃南石。二OD 了ブ口一于D)古、前者仕分析者D予断在交之于1忆デ一夕在探索寸石之上扩目 指这九石茄、客银性左保∽代力)仁、分析者仁上2℃重要左意味茶杨石口一七 ブ卜在取)出世在二上色高石。後者仕重要在意味D杨石概念中力テ寸少一亿 基(D分析亦可能上尔石护、分析者D問题意藏仁心心(、态意的仁分析花 行)之上茶避计乌机在D℃、主靓的在意志忆「污染」含机石恐九色杨石。 桶口仕以上D二∽D了プ口一于D利点花生L、短所補书)上L、 Coder上v、)yプ卜ヴx了左阴凳L大。KH Coder主要在楼能仕以下D上)℃ 石。 段階1:Correlational了プ口一于I亿習、口y七ュ一夕一D多变量解析花 通巴℃、<老马限)分析者D主银的在意志花避计、デ一夕花集钓寸石。 段階2:Dictionary-based了プ口-于化習l\、分析者苏一デ1少ル一ル 左作成L、饭設D検証中問题意藏D追求花行)
10 報技術が進歩しても、それによってすべての問題が自動的に解決するわけでは ない。自動要約ではなく分析というからには、必然的に分析者の判断がそこに は含まれる」。つまり、分析者独自の判断や切口といったものと、客観性と信 ぴょう性とを両立させるためには、なんらかの工夫が求められるのである。 1.2.2 本稿の研究アプローチ 以上のような問題点を踏まえて、本研究では、KH Coder というソフトウェ アを用いて、収集した記事について質的研究を行う。以下では、KH Coder の主 な機能及びそれをいかに本研究に生かすのかについて、説明していく。 a. KH Coder の主な機能 内容分析の研究を踏まえて、テキストマイニングという新たな発想が提出さ れた。それは、コンピューターを使ってデータの中の言葉を抽出し、分析する 方法である。それはさらに二つの分析アプローチに分ける。それぞれ Correlational アプローチと Dictionary-based ア プ ロ ー チ で あ る 。 Correlational アプローチはテキストデータから自動的に取り出した言葉を 使って、クラスター分析のような多変量解析を行うアプローチである。一方、 Dictionary-based アプローチは分析者が自身の判断に基づいてデータから取 り出した概念ないしカテゴリーを使って分析を行うアプローチである。二つの アプローチのうち、前者は分析者の予断を交えずにデータを探索することが目 指されるが、客観性を保つ代わりに、分析者にとって重要な意味があるコンセ プトを取り出せないこともある。後者は重要な意味のある概念やカテゴリーに 基づいての分析が可能となるが、分析者の問題意識に応じて、恣意的に分析を 行うことが避けられないので、主観的な意志に「汚染」される恐れもある。 樋口は以上の二つのアプローチの利点を生かし、短所を補おうとし、KH Coder というソフトウェアを開発した。KH Coder の主要な機能は以下のようで ある。 段階 1:Correlational アプローチに習い、コンピューターの多変量解析を 通じて、できる限り分析者の主観的な意志を避け、データを集約する。 段階 2:Dictionary-based アプローチに習い、分析者がコーディングルール を作成し、仮設の検証や問題意識の追求を行う
Coder住徒来)内容分析欠如龙付c在<、二了プ口一于左融合寸 石二上仁上2℃、徙来0テ半人卜マ才二之少Dデ大)y卜乘)越之大)c 石。分析者D予断在交之少仁デ一夕花要約·提示℃含石利点亦石一方℃、デ 一夕仁对寸石問题意藏追求仁資寸石c两石。冬九仁、口>上ュ一夕一 使2℃デ一夕在处理才石大炒、劾率在大幅仁向上含世、徒来想像∽办本膨 大标デ一夕在分析寸石二上茄可能{仁本2大Dc南马。 b.本研究D手順 本研究、K阳Coder利用L、デ一夕D单本石集計D于、文脈的在分 析)ブ口七又亿上石内容)意味構成亿名注目寸马。具体的在研究)手順仕次) 上书)c两石。 、段階1、デ一夕中办6語花自動的仁取)出L(、D秸果集計 解析寸石。二九仁上℃、分析者D予断花在石心<交之于忆、デ一夕D特徵在 含2大)、デ一夕交要狗L大)才为。具体的仁言)上、主广、抽出語分析℃ 上位50位内D频出語交抽出才石二上℃新聞!仁上马闋速報道)全体像交把握才 石。次仁、「南)十海」交色上仁上位20位内D闋速語左抽出L大)之℃、同横 在記事℃「南之十海」上同時忆出現L大表現D相互阴速性在、「南之十海」 上D共起礻y卜口一夕c横时村石。冬L(、年度别二上仁使力九大特徵語花析 出才石对心分析左行、三衹D南中国海花的<~石報道D变遷在明6办忆L℃、 < 以上D分析休分析者D主櫬的在予断忆「污染」含九℃在接合了ブ口一手 D段階1仁骸当L、本稿D第2章仁℃行力九石。続<第3章c仗、三衹之九老 丸九D重点含凳掘L、確認寸石的亿、特定テ一マ亿)、探℃< 段階2仁入石。段階2仁书℃、分析者加「二)表現苏两九任、口七プ 卜A出現L℃大上見在寸」上∽产指定(口一デ1少儿一儿作成)在積 極的办∽明示的仁行、デ-夕中办6口>七プ卜花取)出寸。无D结果花集計· 解析寸石二上℃、分析在深边℃<。 以上D分析花通心℃、南中国海問厢!二闋才马三大衹報道D立体像交明6小仁 L上5上寸为
11 KH Coder は従来の内容分析の欠如だけでなく、二つのアプローチを融合す ることによって、従来のテキストマイニングのデメリットも乗り越えたのであ る。分析者の予断を交えずにデータを要約・提示できる利点がある一方で、デ ータに対する問題意識の追求にも資するのである。それに、コンピューターを 使ってデータを処理するため、効率を大幅に向上させ、従来想像がつかない膨 大なデータを分析することが可能になったのである。 b. 本研究の手順 本研究は、KH Coder を利用し、データの単なる集計のみならず、文脈的な分 析のプロセスによる内容の意味構成にも注目する。具体的な研究の手順は次の とおりである。 まず、段階 1 では、データ中から語を自動的に取り出して、その結果を集計・ 解析する。これによって、分析者の予断をなるべく交えずに、データの特徴を さぐったり、データを要約したりする。具体的に言うと、まず、抽出語分析で 上位 50 位内の頻出語を抽出することで新聞による関連報道の全体像を把握す る。次に、「南シナ海」をもとに上位 20 位内の関連語を抽出したうえで、同様 な記事で「南シナ海」と同時に出現した表現の相互の関連性を、「南シナ海」 との共起ネットワークで検討する。そして、年度別ごとに使われた特徴語を析 出する対応分析を行い、三紙の南中国海をめぐる報道の変遷を明らかにしてい く。 以上の分析は分析者の主観的な予断に「汚染」されていない接合アプローチ の段階 1 に該当し、本稿の第 2 章にて行われる。続く第 3 章では、三紙それぞ れの重点をさらに発掘し、確認するために、特定のテーマに絞り、探っていく 段階 2 に入る。段階 2 において、分析者が「こういう表現があれば、コンセプ ト A が出現していたと見なす」といった指定(コーディングルール作成)を積 極的かつ明示的に行い、データ中からコンセプトを取り出す。その結果を集計・ 解析することで、分析を深めていく。 以上の分析を通じて、南中国海問題に関する三大紙報道の立体像を明らかに しようとする