小野達也の発言 (行政監視委員会)
⚠️ コピーしたテキストを転載する際は、転載元URL(kokkai-data.com)および原典URL(kokkai.ndl.go.jp)を必ず残してください。発言内容の改変・出典削除は禁止です。
詳細は利用規約をご確認ください。
○参考人(小野達也君) 追手門学院大学の小野でございます。
本日は、このように貴重な機会をいただきまして、誠にありがとうございます。
私は政策評価の理論や方法を専門としておりまして、今回は我が国の政策評価の課題につきまして、政府と自治体の役割という観点も加味しながら意見を申し上げたいと思います。
配付資料の一ページ目を御覧ください。
まず最初に、政策評価の研究と実践の系譜について少し整理をさせていただきます。釈迦に説法となる向きには御容赦をいただければというふうに思います。
政策評価の研究と実践には、しばしば三つの系譜があるとされます。どの系譜も日本で取り組まれておりますが、それぞれ課題が様々あるというのが現状かと思います。
まず、一つ目の系譜が業績測定と呼ばれるものになります。
これは、一つ一つの政策の進捗や結果を数字の指標でモニタリングして、政策サイクル、PDCAサイクルを回そうというものになります。いわゆるニュー・パブリック・マネジメントの潮流に乗りまして多くの国に広まって、単なるモニタリングにとどまらずに、今日は目標値を設定して目標管理を行うというのが標準となっています。
日本でも、九〇年代後半から自治体で一気に導入が進みまして、政府でも二〇〇〇年以降、まずは施策レベルで、続いて事務事業レベルでも制度化されているわけです。また、評価制度の枠の外でも、様々な計画や政策で必須のものとなった感もございます。
二つ目の系譜は、プログラム評価と呼ばれるものになります。
こちらは、個々の政策につきまして、その必要性から論理、プロセス、アウトカム、インパクト、すなわち正味の効果、さらには効率まで体系的に掘り下げて評価するというアプローチになります。今日注目されておりますEBPMというもののコアな部分の源流というのは、このプログラム評価の中で最も重要な段階と言われていますインパクト評価に相当すると。そのインパクト評価に医薬分野の実験の実践ですとか経済学の因果推論の研究などが合流した形で今日のEBPMになっていると言うことができるかと思います。
日本では、残念ながらこのプログラム評価というのは余り実行されておりませんけれども、EBPMはそれとは別の統計改革の議論が発端となってこのインパクト評価が結果的に求められることとなっているというのが現状かと思います。
三つ目の系譜は、しばしば政策分析と総称されるものになります。
事前に政策の費用と効果を推定し、採否やオプションの選択を行うというものになります。
日本の政策評価の制度では、公共事業ですとか規制などの事前評価が義務付けられているわけであります。
日本における政策評価をめぐる近年の議論、その中心は、今申し上げた系譜の一つ目の業績測定に関するものと、二つ目のプログラム評価のうちのEBPMに相当する部分と考えることができます。
以下では、それらについて私の見解を申し述べたいというふうに思っております。
ここで、本日の用語につきまして少しだけ説明をさせていただきたいと思います。
まず、政策という言葉、いわゆる政策の階層の狭い意味での政策、施策、事務事業の全てを含む意味で使ってまいります。
それから、政策評価という言葉も、政策を評価する様々な制度や手法、自治体なども含めて、それらの総称ということで使ってまいります。
また、評価指標という言葉も、政策について客観的に説明する数字、それらの全ての総称というふうに聞いていただければと思います。
それから、エビデンスという語ですが、こちらは、基礎的なレベルから厳密なレベルまでを含むものとして総称してまいりたいというふうに思っております。
さて、本日意見として申し上げたいことは、大きく分けて二つございます。
一つ目は、先ほど一つ目の系譜として挙げました業績測定のタイプの政策評価に関してであります。
配付資料の二ページ目を御覧ください。
まず、その中でもマンネリズムの問題をお話をし、続きまして、古くて新しい問題と言っておりますが、評価指標の取扱い、最後に、今日のEBPMとの関係ということについて申し上げたいというふうに思います。
まず、マンネリズムと評価疲れに関することなんですけれども、この業績測定のタイプの政策評価といいますのは、自治体全体で見れば、総合計画ですとか毎年度の予算編成と連動する形で、もうかれこれ三十年、先行しているところからは三十年、それから、政府の政策評価制度にも四半世紀の実績があるということになります。そのほかに、政策評価の制度の外で行われる業績測定を含めまして、今や公共部門のあらゆるところに行き渡ったと、そういう感がございます。そのこと自体は非常に画期的なことであったと考えております。
しかし、次第にその評価の必要性の自覚ですとか新規性というのが薄れてまいりまして、評価のルーチン化あるいは形骸化というのが目立つようになってまいりました。言わば定例の文書作成作業と化したケースが少なくないと思われます。
このようなマンネリズムの一方で、現場では評価を行うことの負担感は増すということがあります。評価疲れということも言われるようになってまいりました。評価制度を廃止する自治体も増えてまいりましたし、政府の政策評価制度、リニューアルがなされましたが、その背景にもこの各所における評価疲れというものが間違いなくあったということでございます。
このような課題の背景には、評価が使命として実行されるミッションドリブン、これが望ましいわけですけれども、そうはなっておらず、義務的な作業として規則どおりに評価書を作成するという、言わばルールドリブンの作業になってしまっていると。評価についてはこれでは困るということでございます。政府の政策評価制度も早い段階で法制化されまして、言わば強力な制度というふうになりましたけれども、結果として厳格な運用ということが強調され過ぎた嫌いがあると思っております。
また、形式的に目標管理の作業のみが各所で必須とされる状態となっておりますけれども、近年様々なところで聞こえてまいりますが、数字の指標や目標値による管理、PDCAサイクル等への疑念あるいは批判、そういったものの原因になっている可能性があるかと思います。可能な限り定量評価せよというのは、今日の政策評価の基本的なテーゼということになると思います。私も強く共感いたしますけれども、ここで定量というのは言わば妥当性のある定量のことであって、無理やりにですとか、形式的なものということでは決してないと思います。この辺り、世の中でかなり誤解されてしまっている感がございます。
しかし、これからの時代の政府、自治体において、業績測定に基づいて政策を取捨選択し、資源配分を最適化するということの必要性は、増すことはあっても減ることはないというふうに考えております。
続いて、古くて新しい問題としておりますが、お話をしたいと思います。
約三十年前に業績測定のタイプの評価が始まった当初から、政策の成果、いわゆるアウトカムと呼ばれていますけれども、それを測る指標の設定が難しいという声が一貫して多数ございます。政府も自治体も多くの、数多くの研修を実施して、マニュアルも用意してきたわけですけれども、大勢は変わっていないという状態です。確かに、その社会科学の測定というのは、自然科学と比べて間接的なものになりますし、行政の評価指標というのも企業経営の評価指標とはまた別の、更に多元的な評価軸が必要になりますので、難しいという事情はあるわけです。どのような研修が効果的なのか、あるいはどういうマニュアルが必要なのか、この辺り、改めて考える必要があると思っております。
近年はロジックモデルという、その政策の実施前の過程から成果の発現までの論理的な関係を流れ図にすると、そういう絵を描いた上で評価指標を設定するという方法、これが幸いにも日本でも取り入れられるようになってまいりました。これは大変結構なんですけれども、現場の様子を見ると、これもルールドリブンになりがちなところがございます。
さて、それで、アウトカム指標がそれなりに設定されたとして、更に二点ほど指摘したいことがございます。
一つは、その政府の各府省が設定するアウトカム指標というのは、最終的には国民生活ですとか全国の各地域における成果そのものを測りたいところなんですが、そういうものが乏しいという点でございます。多くは、自治体行政でどういう取組が、政府の政策によって自治体行政でどういうことが行われたというような、そのような把握にとどまっているものが多くて、一言で言えば、データの連携を欠く状態であるということが言えます。
もう一つは、政府、自治体の設定する評価指標のほとんどは、いわゆる総数とか平均の把握にとどまっておりまして、その内訳、地域別ですとか対象者の属性別の集計など、そういうものが非常に乏しい状態になっているということであります。仮に総数や平均が同じでも、偏りがあるかないか、政策の評価にとって重要な観点であろうというふうに思います。
また、評価指標の良しあしというのが、その妥当性、つまり測るべきものを測っているかどうかで決まるということが言えます。評価指標の妥当性が不足していれば、その後、評価指標を使った議論というのが意味を失ってしまうということになります。この評価指標の質というものについても、やはり何らかの点検、これまでもないわけではないんですが、点検を強化するということが望まれるということでございます。
それから、政府において政策評価制度や行政事業レビューという形で業績測定のタイプの評価というのが、少なからぬ課題があるとは言いつつもそれなりに定着したと言えますけれども、近年、EBPMというものの関係で関心が改めて高まったというところがございます。現在の政府のEBPM、広い意味でのEBPMには、この業績測定のタイプの評価が基礎的なEBPMと位置付けられております。
現在の政策評価全体を見ますと、その評価対象という意味では、この業績測定のタイプの評価の対象となっているものが圧倒的に多いわけです。そういう意味では、この業績測定の改善というのが非常に重要な意味を持ってくるということでございます。このEBPMの、基礎的なEBPMという位置付けになったというのは、その改善に向けて追い風になると期待している次第でございます。
少し、今日はこれ以上具体的にお話しする時間はありませんけれども、資料二ページ目の下の方にはややちょっと具体的な、技術的な問題を書いております。
続きまして、資料の三ページ目に参ります。本日、意見として申し上げたい大きな二つ目の話でございます。
御承知のように、エビデンスという概念は階層構造があると考えるべきなわけですけれども、様々な方が様々な形の整理をされています。この配付資料の三ページの上の方に挙げました図は、政策の立案、評価の手法と、それからエビデンスの階層というものを対照させた私なりの整理でございます。
図の左側が政策の立案と評価の手法です。どのような評価や分析の結果に基づいて政策を決めるのかという観点で分類しております。右側は、いわゆるEBPMの議論におけるエビデンスのレベルと言われるものの大まかな分類になります。共に、上の方に行くほど厳密なエビデンスを扱います。御承知のように、アウトカム指標が改善したとして、その変化は本当にその政策によってもたらされたのか、あるいはほかの要因を取り除いてもそうなのかという因果関係が求められるということになります。この図の一番下には、やはりどのようなレベルであれ、統計の誤用や濫用というのは起こり得ますので、そのようないわゆる統計のうそがないことが実は全ての議論の土台になるという意味で下に付け加えております。
このような構造についてまず申し上げたいことは、この図の上の方の厳密なエビデンスと、それから下の方の基礎的なエビデンスとが政策の現場において別物であってはならないということであります。これはしばしば言われる例えとして、スポーツの試合というのがあります。試合のスコア、何かスポーツをしていて、試合のスコアが結果として非常に重要なわけですけれども、それを踏まえて、コーチなり監督が原因の分析や作戦の検討をするということになるわけであります。つまり、業績測定の広く浅い評価から掘り下げた分析を行うべき政策を決めて、選んで、発見して因果関係を突き止めるという一連の過程ということになります。ところが、現状の例えば府省さんの取組などではこれが別物になっているというのが現状ではないかというふうに思っております。
また、業績測定型の評価において、最終アウトカムの前の段階をきちんとチェックをする、あるいは、アウトカムの、先ほど触れましたアウトカムの内訳を比較したりする、そういったことが厳密なエビデンス追求との間に入るような、間をつなぐ分析として有効な場合があるのではないかとも思っております。
三ページ目の下の方になりますが、エビデンス追求の目的ということでちょっと何点か書いております。
まず、二つ目の項目をちょっと先に述べさせていただきたいんですが、より厳密なエビデンスを推計する試みというのが各省で今行われておりますけれども、その何を対象にするかというところで、分析が可能で効果を確認できそうな政策は対象とするというような印象がございます。現在まだ実証研究ということで、準備段階ということかとも思います。
それから、その上に一つ目として挙げている点ですけれども、ある研究で推計された結果というのがあったとして、それがそのまま現実の政策のエビデンスとなるとは限らないということです。研究結果として出たものと政策の本当の効果として扱うものとの間には若干距離がある場合があるということも指摘したいということであります。
それから、ちょっと三点目、一番下のものはちょっと省略をさせていただきたいと思います。
配付資料の最後になりまして、持ち時間残り少なくなってまいりましたので、国民的関心事に関する評価の検証、これは是非、国会といいましょうか、国として考えていただきたいということで、例えば私の学生に課したレポートなんかでも書いてきますけれども、例えば総理大臣が徹底的に検証するという趣旨の発言があったものとして、例えば地方創生の第一期ですとか新型コロナ対策などは、それに相当するものは現実には示されていないのではないかというようなことがあります。そのようなものをきちんとデータに基づいて示されれば、非常にEBPMの何たるかということを広めるということにもなろうかというふうに思います。
大変恐縮ですが、最後の五番のところは後書きのようなことで何点か書いているものですので、少し時間ももうこれで尽きましたので、私の話はここまでにしたいというふうに思います。よろしければ、また御質問でお尋ねいただければと思います。
御清聴ありがとうございました。