背景

議会においては,法律・予算の作成や政治的な課題の解決のために話し合いが行われおり,その内容は会議録として公開されています.議会で議論された内容を理解したり,広く周知したりするためには,その内容に対する構造解析や要約が必要となります.自然言語処理においては談話構造解析や自動要約の研究がなされており,そうした技術を議会会議録に適用することが考えられます.しかし,一部の議会会議録においては一括質問・一括答弁という特殊な形式が取られている場合があり,従来の手法をそのまま適用できないという問題があります.

目的

QA Alignmentにおいては,一括質問・一括答弁の形式議会会議録を一般的な一問一答形式に変換することを目的とします.具体的には,対応する質問と答弁に同じIDを付与することによって,質問と答弁の対応付けを行います.

  • 入力
    • 議会会議録(JSON形式)
  • 出力
    • 上記の議会会議録中のQAIDのフィールドの値を埋めたもの
  • 評価
    • 対応付けされた質問文と答弁文のペアの数に基づく適合率・再現率・F値
    • 正解データは,都議会ネットレポートにおける対応付け

データ構造

Question Answeringの会議録のデータに QorA,QuestionerID,QAID の3つのフィールドを追加したものになります

フィールド名 説明 備考
Volume 年、回 会議録の表記、何年の第何回定例会かを表す
Number 会議録の表記、何日目かを表す
Date 日付 yyyy-mm-dd
Title 会議録の表題 会議録の表記
SpeakerPosition 発言者の議席番号または役職 会議録の表記
SpeakerName 発言者の氏名 会議録の表記
QuestionSpeaker 発言に対応する質問者の氏名と役職
Speaker 発言者の氏名と役職
Utterance 発言
QuestionerID 発言に対応する質問者の氏名と役職 QuestionSpeakerと同様だが異なる会議を通じても一意の値
QorA 発言者の識別 値はQ(質問者),A(答弁者),O(その他)のいずれか
QAID 質問答弁ID 対応する質問と答弁に同じ正の整数が付与される.
0は特別な値で,質問でも答弁でもない発話に付与される.

JSON (出題ファイルの例)

[
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "初めに、都政運営の方針について、都の財政運営について質問します。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "今回の議会は震災対策が中心となり、そのための補正予算一千三百七十四億円が議論されます。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "その財源は、基金からの繰り入れが約半分の七百五億円となっています。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "今後、震災による厳しい景気状況のもと、都税収入も不透明です。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "十一月には東京都防災対応指針が示されるとのことですが、建物の耐震化や津波、高潮対策等にさらに多くの予算が必要になると思われます。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "かねてから景気の低迷の影響もあり、長期的に見たときに、少子化や高齢化の影響もいわれてきた中、今後は震災への対応も加わることで、より厳しい財政運営が予想されます。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "都の財政運営についての考えを伺います。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "次に、都政の課題と「二〇二〇年の東京」について伺います。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 2},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "三十一番", "SpeakerName": "中村ひろし", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "中村ひろし(民主党)", "Utterance": "今議会は都知事選挙後初の議会でもありますので、今後の都政の取り組みについて質問したいと思います。", "QorA": "Q", "QuestionerID": "2011_02_g01", "QAID": 2},
...
"QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "このたびの大震災は、都政を取り巻くあらゆる環境に根本的な変化をもたらすものであり、その対応は、今年度のみならず、来年度以降も含めた息の長い取り組みとなります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "したがいまして、財政環境の先行きを見通すことが困難な中にありますが、緊急対策の着実な実施を初め、都民の不安を払拭し、東京に活力を取り戻すという都政の使命を今後とも確実に果たしていくことが重要であります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "そのためには、これまで一貫して進めてきた堅実な財政運営という原点に立ち返り、これを堅持していかなければならないと認識をしております。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "引き続き、事業評価などの取り組みを着実に進め、基金残高の確保など、財政の対応力にも配慮しながら、都民の負託にしっかりとこたえるべく、全力を尽くしてまいりますが、その際には、この点は昨日も知事が強く申し上げたところでございますが、法人事業税の暫定措置の即時撤廃が必要と考えます。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "その観点で、国の社会保障と税の一体改革について申し述べさせていただきますと、国は六月二十日までに成案を取りまとめるとしていたにもかかわらず、いまだに決められておりません。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "消費税引き上げの時期などに加え、社会保障の現場を担う地方の独自財源となる地方消費税の拡充についても、明記されるかどうか不明であります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "今後、社会保障費がふえるのは地方も同じであり、社会保障制度を安定的に運営するのであれば、消費税だけでなく、地方消費税も拡充すべきことは当然であります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "あまつさえ議論の前提であるべき法人事業税の暫定措置の撤廃については、議論をした形跡すら見当たらないところであります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "かつて、国は、この不合理な措置を税制の抜本改革までの暫定措置と断言していましたが、今後さらに継続されるとすれば、それは明らかな約束違反であります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "財務局長", "SpeakerName": "安藤立美", "QuestionSpeaker": "中村ひろし(民主党)", "Speaker": "財務局長", "Utterance": "本気で税制の抜本改革を進めるならば、国はこれまでの経緯もしっかり踏まえ、まずは暫定措置を直ちに撤廃し、消費税はもとより地方消費税も拡充すべきであり、都として引き続き国に対して、あらゆる機会をとらえ、強く働きかけてまいります。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 1},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": null, "SpeakerName": null, "QuestionSpeaker": null, "Speaker": null, "Utterance": "〔知事本局長秋山俊行君登壇〕", "QorA": "O", "QuestionerID": "", "QAID": 0},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "知事本局長", "SpeakerName": "秋山俊行", "QuestionSpeaker": null, "Speaker": null, "Utterance": "「十年後の東京」計画の改定についてでありますが、これまで都は、「十年後の東京」計画のもと、環境、安全、福祉、産業などさまざまな分野で先進的な施策を推進してきましたが、計画期間が半ばを迎えたことに加えまして、東日本大震災によりまして新たな課題も明らかになってまいりました。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 2},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "知事本局長", "SpeakerName": "秋山俊行", "QuestionSpeaker": null, "Speaker": null, "Utterance": "こうした状況を踏まえまして、「十年後の東京」計画を改定し、東京を新たな成長軌道に乗せる道筋を示すことといたしました。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 2},
{"Volume": "2011-2", "Number": "3", "Date": "2011-06-24", "Title": "平成二十三年東京都議会会議録第九号", "SpeakerPosition": "知事本局長", "SpeakerName": "秋山俊行", "QuestionSpeaker": null, "Speaker": null, "Utterance": "改定に当たりましては、高度な防災力を備えた安全・安心社会の創造、エネルギー政策を柱に据えた環境と経済が両立した都市の実現などを視点といたしまして、都民生活の質の向上や、都内経済の発展へつなげていく考えでございます。", "QorA": "A", "QuestionerID": "2011_02_g01", "QAID": 2},

]

正解データとテストデータ

正解データでは,上記のキーの値がすべて埋まっています.テストデータでは,質問者と答弁者(QorAの値がQもしくはA)の発話文のQAIDが-1になっており,それ以外の値は正解データと同じです.QAIDの値が-1になっている箇所に正しい値を推測することが今回の課題になります.
なお,正解データやテストデータにおいては議会会議録全体の発話文が含まれていますが,質問がなかった日(施政方針説明の日など)のデータには,QuestionerID,QorA,QAID のキーが含まれていませんので,ご注意願います.