背景
政治には、収入と支出を考慮し、お金の使い道を決める予算作成の役割があります。 国の予算は、内閣で予算案が作成され、その予算案をもとに国会で議論された後に成立します。 また、地方自治体の予算は、知事や市長により予算案が作成され、議会で審議された後に成立します。 しかし、予算は、どのような背景に基づいて予算案が作成され,どのような議論を経て成立しているのかを把握しづらいという問題があります。
目的
Budget Argument Miningでは、公開されている予算書類を対象として、会議録に含まれる議論と結びつけることを目的としています。 具体的には、予算項目(金額、管轄省庁・部局名、説明)が与えられたときに、議会会議録に含まれる政治家の予算関連の発言(金額表現を含む発言)をみつけだし、3つの議論ラベル[ Claim(主張)」「Premise(根拠)」「その他」を付与します。
- 入力
- 予算項目(予算ID,金額,管轄省庁・部局名,説明)
- 議会会議録(議会名、発言者、発言内容,金額表現,関連ID,議論ラベル)
- 出力
- 議会会議録 – 固有表現抽出器(GINZA 4.0)で付与した金額表現 – 関連IDに予算項目の予算IDを付与する
– 議論ラベル (Claim, Premise など7つのクラス)- Premise : 過去・決定事項
- Premise : 未来(現在以降)・見積
- Premise : その他(例示・訂正事項など)
- Claim : 意見・提案・質問
- Claim : その他
- 金額表現ではない
- その他
- 議会会議録 – 固有表現抽出器(GINZA 4.0)で付与した金額表現 – 関連IDに予算項目の予算IDを付与する
- 評価
- 議論ラベル
- 正解率 = 正解議論ラベル ➗ 議論ラベル数
- 予算表への連結 (F値)
- 再現率 =出力に含まれる正解数➗正解の数
- 適合率 =出力に含まれる正解数➗出力の数 (連結数)
- 総合評価(リーダーボードに記載される代表スコア)
正しい議論ラベルが付与かつ正しい予算IDが含まれる
金額表現数 ➗ 議論ラベル数
- 議論ラベル
アノテーションについて
どのように議論ラベルを付与するのか?
「Claim(主張)」「Premise(根拠)」「金額表現ではない」「その他」 に分ける
Claim(主張)は、意見・提案・質問表現による主張をまとめており、それ以外を「その他」とする。 Premise(根拠)は、時間軸で「過去」と「未来」に分け、どちらにも当てはまらない場合を「その他」とする。
どのような議論ラベルがあるのか?
- Premise : 過去・決定事項:過去(前年度)の予算、既に決定済み金額、過去の予算額など
-
30年度の課税に反映された額で申しますと約 4,500万円となります
- 令和元年以降の場合、過去となる
-
30年度の課税に反映された額で申しますと約 4,500万円となります
- Premise : 未来(現在以降)・見積:今年度の予算、現在審議中の金額、見積額、予測の金額など
- ふるさと納税関係経費が 4,670万円計上されています
- 見積として計上されているので、未来(現在以降)となる
- ふるさと納税関係経費が 4,670万円計上されています
- Premise : その他(例示・訂正事項など):
- Claim : 意見・提案・質問:
- 「最低でも小学校卒業までの外来分を無料にすることで大いに子育て支援になります」
- 「一兆円では全然足りません。」
- Claim : その他
- 金額表現ではない
- その他
「argumentClass」を付与する単位は「節」とする。
- 節は「複文を構成するところの、述語を中心とした各まとまり」である (益岡・田窪 1992)。
- 複文とは(1つの述語で1つの文を構成する単文でなく)2つ以上の述語が含まれる文のことである。
- 節は、文末に位置する「主節」と、それ以外の「従属節」に分けられる。
relatedID とは何か?
relatedIDは、会議録の発言に含まれる金額表現に付与します。会議録に含まれる金額表現と関連のある予算項目(budgetId)と結びつけます。
対象
国会・衆議院 と 3つの自治体
- 国会・衆議院
- 012033 北海道 小樽市
- 080004 茨城県
- 401307 福岡県 福岡市
対象とする会議録と予算
- 国会・衆議院
-
012033 北海道 小樽市
- 令和元年(コロナ前)、2019年 定例会第1回
- 令和2年(コロナ後)、2020年 定例会第1回
- 080004 茨城県
- 401307 福岡県 福岡市
予算のフィールド名
- 福岡市の場合、令和2年度4月補正予算案 は、 第1次補正予算と考え、01とする。
フィールド名 | 説明 | 例 |
---|---|---|
budgetId | 予算の識別子 | ID-2020-401307-00-000001 |
budgetTitle | 予算タイトル | 令和2年度当初予算案 |
typesOfAccount | 会計種別(一般会計、特別会計) | |
department | 管轄省庁・部局名 | 財政局 |
url | 元データのUR:L | https://www.city.fukuoka.lg.jp/data/open/cnt/3/73586/1/05.R2juuyousesaku.pdf?20200213220202 |
budgetItem | 予算項目 | “持続可能な財政運営に向けた取組みの推進” |
categories | 上位階層、カテゴリ(詳細→概要の順) | [] |
budget | 今年度予算 | 404千円 |
budgetLastYear | 前年度予算 | null |
description | 説明部分 | 平成29年6月に策定した「財政運営プラン」の取組みの方向性を踏まえ、市民生活に必要な行政サービスを安定的に提供しつつ、重要施策の推進や新たな課題に対応するために必要な財源を確保できるよう、政策推進プランに基づき投資の選択と集中を図るとともに、歳入の積極的な確保や行政運営の効率化、既存事業の組替えなどの不断の改善、市債残高の縮減などに取り組む |
budgetDifference | 比較増減額 | null |
予算の json
[
{
"budgetId": "ID-2019-012033-00-000001",
"budgetTitle": "平成31年度当初予算案",
"url": "https://www.city.otaru.lg.jp/docs/2020121200484/file_contents/03_H31_syuyo_zigyo_sashikae_r01.pdf",
"budgetItem": "病児保育事業費補助金",
"budget": "4,275千円",
"categories": [
"保育環境の整備 《公約1-①》",
"安心して子どもを生み育てることのできるまち(子ども・子育て)"
],
"typesOfAccount": null,
"department": "福祉部",
"budgetLastYear": null,
"description": "市内の保育所・幼稚園・認定こども園、小学校に通う1歳6か月から小学校2年生までの児童を対象に、病気になった際の一時保育を実施する学校法人小樽学園いなほ幼稚園に対する補助",
"budgetDifference": null
}
]
会議録のフィールド名
フィールド名 | 説明 | 例 |
---|---|---|
date | 日付 | “2001/8/8” |
localGovernmentCode | 自治体コード(6桁) | 011002 |
localGovernmentName | 自治体名 | “小樽市” |
proceedingTitle | 議会名 | “” |
url | URL | “” |
proceeding | 発言者と発言内容 | [] |
└ speakerPosition | 役職 | 知事・市長・議員・議長・その他 |
└ speaker | 発言者 | 迫 俊哉 |
└ utterance | 発言内容 | 令和2年第1回定例会の開会に当たり… |
└ moneyExpressions | 発言内容に含まれる金額表現 | 例 |
└ moneyExpression | 金額表現 | “2億 3,740万円増” |
└ relatedID | 関連する予算のID、リスト型で複数のIDを格納できる | [] |
└ argumentClass | 議論ラベル | “決定事項” |
会議録 json
[
{
"date": "2019-02-20",
"localGovernmentCode": "011002",
"localGovernmentName": "小樽市",
"proceedingTitle": "平成31年第1回定例会 本会議録",
"url": "http://",
"proceeding": [
{
"speakerPosition": "市長",
"speaker": "迫 俊哉",
"utterance": "平成 31 年第1回定例会の開会に当たり、ただいま上程されました各案件に係る提案理由の説明に先立ち、幾つか申し述べさせていただきます。まず、歳入についてでありますが、市税につきましては、個人市民税、法人市民税などで減収が見込まれるものの、固定資産税、都市計画税などで増収が見込まれることから、2.7%、3億 5,280万円増の135億 7,350万円を見込みました。",
"moneyExpressions": [
{
"moneyExpression": "3億 5,280万円増",
"relatedID": null,
"argumentClass": "Premise : 未来(現在以降)・見積"
},
{
"moneyExpression": "135億 7,350万円",
"relatedID": null,
"argumentClass": "Premise : 未来(現在以降)・見積"
}
]
}
]
}
]
参考文献
予算項目に関連する議論を対応づけるBudget Argument Mining のデータセット構築 木村 泰知, 永渕 景祐, 乙武 北斗, 佐々木 稔 情報処理学会 第249回自然言語処理研究会 2021年7月
国会および地方議会の予算審議を対象としたBudget Argument Miningタスクの提案 永渕景祐, 土屋彩夏, 木村泰知 言語処理学会第27回年次大会(NLP2021) P6-13 2021年3月