研究倫理

2025年6月19日(木)
開発研究センター
ミクロ経済分析研究グループ

伊藤成朗

研究倫理

仕事は社会・業界の行動規範の範囲内で実施します


法令、組織の規則、社会通念、業界通念


研究業界(学界+その周辺)にも特有の規範=研究倫理があります


本講義の目的: 研究コミュニティに身を置く者が研究倫理逸脱で失敗しないようにすること


崇高な研究哲学論ではなく、実際的な自衛の話

研究倫理 = {狭義の研究倫理, 研究公正}

極言すると


研究倫理とは


研究で対象社会に迷惑をかけないという原則


研究公正とは


研究でごまかしをしないという原則


対象社会は日本や学界も含みます

研究は社会と契約を結んで実施しています


よって、これらは最低限の原則です


それでも足をすくわれる研究者はいます


どう判断すれば分からなくなったとき、大原則に戻ると考えやすいです


社会から託された信任を裏切らない

  • Do good for the society (not just for oneself/clients).

  • Be honest to the scientific standard (not just to oneself).

ごまかしのある研究は社会に迷惑をかけるように、研究公正と研究倫理はきれいに分かれず、相互に関連する部分があります

研究公正の鳥瞰図研究 が示す研究公正のキーワード: honest, rigorous, transparent, open, respect and stewardship of research, care for the people of research.

写真はJAXA記者会見映像からキャプチャしました

科学的根拠をもとに研究し、得た知識を歪めずに発表すること。

研究公正は、やってはいけないことで定義されます。

一発退場 Research misconducts (FFP, 厚労省研究不正ガイドライン「特定不正行為」)

Fabrication ねつ造「存在しないデータや研究成果を作成すること。」

Falsification 改ざん「操作」によって「データ」や「成果などを真正でないものに加工すること」。

Plagerism 剽窃、盗用 他の研究者の「アイディア」「方法」「データ」「結果」を「了解または適切な表示なく流用すること」。

  • やると研究者人生がほぼ終わります。
  • 理由: 研究者社会は相互信頼で成立しています。ウソをつかないことを前提に評価がされて、知識が共有されます。裏切ると、研究者社会全体が資源を浪費するので、厳罰処分されます。不正が露見するまで、他の研究者は存在しない現象を追求して苦しみます。
    • STAP論文: 追試資源や継続研究資源の浪費、周辺研究まで疑いの目
    • 不正をする人は自分の利得だけで社会への影響をほぼ無視

信用失墜 Questionable research practices (QRPs)

  • データの未保存や再現性の欠如
  • 不適切な統計手法
  • ギフト・オーサーシップ (CRediT)
  • 論文の多重投稿
  • 利益相反によるバイアス

See a list of QRPs used in Dutch national survey (DNSRI) summarised here

蔓延度は不明ですが、結構深刻では?

例1: Dutch National Survey on Research Integrity (Gopalakrishna, Riet, Vink, Stoop, Wicherts, and Bouter, 2022):

  • 15大学+7医学研究所、大学院生以上、61865人メール送達、6813人回答(11%)、過去3年
  • 回答者内訳: 人文科学(全体の9%)、社会・行動科学(同29%)、生命・医学科学(同40%)、自然・工学科学(同22%)
  • 大学院生(全体の30%)でも準教授以上(同30%)でも回答内容の傾向はほぼ同じ

FF(P) 8.3% engaged in any FF(P).

QRP 51.3% engaged frequently in at least 1 QRP.

Beh&Soc.Sci 5.7%

Beh&Soc.Sci 50.2%

蔓延度は不明ですが、結構深刻では?

例2: The International Research Integrity Survey (Allum, Reid, Bidoglia, Gaskell, Aubert Bonn, Buljan, Fuglsang, Horbach, Kavouras, Marusic, and et al., 2022):

  • Web of Scienceのジャーナル21894誌・本、2016-2020年、816万 → 392万 → 375万 → 307万2372 (対象国: 米欧)
  • Stratified random sampling (strata=natural, medical, social sciences and humanities)
  • (おそらく)307万にemail送付 → 73757が回答 (ウェイト後回答率=7.2%) → 64074 (分析標本サイズ)
  • 過去3年のQRP(IRISSupplementaryTable.xlsx, download)

ギフト・オーサーシップ: 69.0%(欧)、55.1%(米)

予想と矛盾する結果の秘匿: 25.8%(欧)、20.3%(米)

信念と矛盾する先行研究の無視: 20.5%(欧)、15.3%(米)

不完全な査読をする: 53.8%(欧)、49.7%(米)

剽窃: 6.4%(欧)、6.5%(米)

QRP率: グループ別の内訳
Figure 1

蔓延度は不明ですが、結構深刻では?

例3: Data Collada (psychologist blog) vs. Francesca Gino (HBS prof), 2021-

蔓延度は不明ですが、結構深刻では?

例5: ミクロ開発経済学研究者Asad Islamの複数論文でデータ不正(FF)の疑い

Institute For Replicationによる再現性分析で指摘

Retracted

  • Journal of European Economics Association
  • Economic Development and Cultural Change
  • European Economic Review
  • Economic Journal
  • Journal of Public Economics (under review)
  • (American Economic Journl: Micro)
  • (Review of Economics and Statistics)

なぜFFPをするのか

Gino: HBS給与は1.4億円+印税+講演料、ばれなければ大金

  • 日本の文系(<2000万円)だとFFPは割に合いません
  • 国立医薬品食品衛生研究所所長で1900万円くらい

結構ばれる: Ginoは追試、食品衛生部長は内部通報、Islamは経済学界の再現可能性指向


貧乏くじ


オッズをよく知らないまま、自ら進んで引くのは賢くない

The university’s top governing board, the Harvard Corporation, decided this month to revoke Francesca Gino’s tenure and end her employment at Harvard Business School. (WGBH news)

自分は本当に大丈夫か?

アジ研: 外部から研究者成果に剽窃を指摘される(外部委員2018年、内部委員2024年)

  • 対応: 調査委員会設置、事実認定、事実公表、処分、(科研費)文科省への事実・原因・処分の報告

公正な研究? QRP?

和文単行書の成果検討では…

  • 成果を冗長に書く
  • 要約が不正確
  • どのような過程を踏んだか明記しない
  • 図表の脚注に留意事項を説明するが本文は無記載
  • 研究なのにダークパタン
  • 過去著作の数段落を明示せずコピー、ただし、参考文献には掲載

Githubで研究過程を公開=ピア・レビューを活用

なぜQRPをするのか

成果を出したい、でも、今のままだと成果にならないと考えている

内容が不十分

  • 結果がはっきりしない
  • 2つの結果が矛盾する
  • 何を議論すべきかもよく分からない
  • 不適切な統計手法
  • データの未保存や再現性の欠如
  • 曖昧な記述と結論…QRP?
    • 結論は曖昧です、と明確に書けばok
    • 単に記述を不明瞭にするのはごまかし=QRP
  • 過程(データとコード)を公開
  • Pre analysis planを公開・登録

なぜQRPをするのか

自信、発信力が無い

  • ビッグ・ネームの推薦を利用したい
  • ギフト・オーサーシップ
  • 反例: ネットワーク理論: Erdős-Rényiモデル. Erdősは1525論文掲載

時間がない

  • 今までの研究に手を加えるだけ
  • 他者の成果・アイディアを取り込む
  • 多重投稿、多重出版
    • 機械学習で簡単に判明
  • 剽窃

利益相反

  • スポンサーの利益と研究結果が一致
  • 余計な詮索をされたくない
  • 利益相反があることを表明しない
    • 簡単に判明
  • 研究が健全ならば、利益相反表明しない理由がない

出版社もFFP, QRP通報窓口を設置

COPE

大規模言語モデル(LLM)時代のリスク

Fabrication, falsification、plagerism回避のルール

  1. 文章出力をそのまま使ってはいけない
  1. 図表や推計は与えたデータのみから出力する
  • FF
  • 自分でコードを書く、自分でexcelを操作する方が安心できます
  1. 与えた以外の外部情報を用いるかは必ず指定する
  • FFP
  • ICMJE推奨事項ではどのように使ったかを具体的に明示するように要求

大規模言語モデル(LLM)時代のリスク

作業委託を効率的にするための方針

真偽を確かめやすい単純労働を担わせる

  • 「以下の出来事を時系列順に並べ替えて、日付と出来事の2列からなるtab separated text形式で出力して」
  • 「この論文の数式を全部抜き出して」
  • 「変数と定義をmdの表にして出力して」

真偽を確かめにくいが、作業の一部を担わせ、自分がその内容を確認する

  • 「この論文の内容をこういうふうに要約して」
  • 「(3)式から(5)式までの導出過程を詳細に説明して」
  • 「この文章をもう少し簡単に言い換えて」

大規模言語モデル(LLM)時代のリスク

ある程度の理解があれば、データさえ与えると実証論文は書ける

  1. OpenAI’s DeepResearch: 研究課題を与える→分析手法を書かせる→その手法をRで実施するための指示書を書かせる
    • 使える出力を得るためには、研究をある程度は理解して課題を書かねばならない
  2. Cursor: 指示書を読み込ませてRで(サンプル・データ作成コードもしくはデータ整形コードと)推計コードを書かせる→結果をquartoで出力させる
    • その例
    • 間違えも少しはあるようです
    • cursorを繰り返し使うことで、データに関する作業や推計コードをミニマルで直感的に理解しやすい内容に修正可能、という声も

大規模言語モデル(LLM)時代のリスク

ある程度の理解があれば、データさえ与えると実証論文は書ける

  1. DeepResearch: 研究課題→分析手法→指示書
  2. Cursor: 指示書→推計コード→quartoで出力
  • 方法が適している理由を自分が理解する前に論文が書ける
    • コメントや疑問に自分は答えられない(が、LLMは答えられるかも)
    • しかし、(何をやったかの)透明性はあるので、結果の解釈はできる
  • 課題も機械に考えてもらい、こうした成果を量産するのが最適
    • 新しい方法が出てきたら、既存の量産成果を批判し、量産成果修正
  • 人間研究者: 量産型研究成果を扱っているとLLMに代替される
    • Fill the gap in research…アルゴリズムで想定できるgapだと危うい
    • データに新規性があれば代替されないが、常にデータを作るのは困難

研究対象(者の人権)保護、研究コミュニティの評判維持

研究倫理は、守るべきことで定義されます

3つのレイヤー (Mustajoki and Mustajoki, 2017, p.37)

  1. 法的義務

個人情報保護、人権・動物の権利保護など

  1. ガイドライン

インフォームド・コンセント、研究の正確さ、貢献の正確さ、研究協力者の表示、など

  1. 暗黙の了解
    • ? (分野や組織ごとにあるルールなど、らしい)
  • 論文への質問に著者は真摯に答える
  • 内容を批判しても著者の人格まで批判しない
  • 読む前後で自分の知識がどう変わったか書く
  • 研究をより良くするため、読者がより正確に理解するためにコメント・批判をする
  • 問題の指摘で終わらず結論にどう影響するかまで書く

最後の3つはMacartan HumphreysのHow to critiqueから抜粋

途上国研究における研究倫理8ポイント (Emanuel, Wendler, Killen, and Grady, 2004)

  1. Collaborative partnership 対象個人や社会が便益を受ける研究か。
  2. Social value 社会的に価値のある研究か。
  3. Scientific validity 科学的裏付け(知見を得る方法論)はあるか。
  4. Fair subject selection 参加者は公平に選ばれたか。
  5. Favorable risk-benefit ratio リスク相応の便益はあるか。個人リスク、社会便益。
  6. Independent review 独立機関が審査したか。
  7. Informed consent インフォームド・コンセントを得たか。
  8. Respects for recruited participants and study, communities 個人や対象社会の意思を尊重経過・結果を伝達したか。

殆どの社会科学研究(=観察研究)

  • 便益は無く、リスクも個人情報漏洩以外は僅少、社会的価値もよく分からないので、参加者を公平に選ぶべき理由は倫理に照らしてあまりない。
  • 審査の独立性、インフォームド・コンセント、個人情報保護、意思の尊重は手続きに関する考慮。科学的裏付けは研究をする動機。
  • あらゆる調査・研究で満たすべき項目であり、研究倫理審査が特別なことをしているわけではない。

企画段階:

  • やる科学的価値=社会的価値はあるか…既存研究と違いはあるか?
  • 対象選定、標本サイズ、質問票などの研究デザインは十分か=知見が得られる見込みがあるか?
  • 個人情報保護の手段は考えたか?

実施段階:

  • 研究説明書(research information sheet): 研究の概要と連絡先を説明
  • 研究同意書(informed consent): 参加者の権利+何に同意したのか+署名
    • いつでも参加拒否できる、いかなる質問にも回答拒否できるなど
  • 必要に応じて研究倫理審査委員会の推薦状、現地IRB (institutional review board)の推薦状・許可状

分析段階:

  • ハードコピーは鍵付き書庫に保存したか
  • 分析用データは個人識別子と分離したか
  • おもに介入研究が対象: 本審査
  • 雑誌によっては観察研究でも要求する場合がある: 迅速審査
  • 判断に迷う場合は研究倫理審査委員会事務局(研究企画課)へ相談を
  • 研究倫理審査委員会は研究倫理に適合しながら研究実施できる方法を共に考える場所です。
    • 例: COVID-19下で感染リスクを日常生活以上に高めずに調査する方法などを検討

経営者が研究倫理審査や研究能力を軽視すると、配下の研究者が研究倫理・研究公正から逸脱するのを防げない

JAXAの研究倫理・研究公正違反 (2016-2017)

  • 閉鎖環境負荷試験: 2週間×5組、計42人の研究対象者 … 宇宙兄弟(3)
  • ストレス反応を測定、ストレスマーカー候補の絞込
  • 1.9億円
  1. Fabrication (nonexisting data)
  2. Falsification (edited data)
  3. Insufficient scientific validity
  4. Lack of saved data and research notes (for reproducibility)
  5. Lack of informed consent after a protocol change
  • この実験で新たなストレス・マーカーが得られるのか? 得てどうするのか?
  • 被験者負担、多額の資源に見合う新規の科学的価値があるか (NY Times記事)?
  • HI-SEAS (Hawaii Space Exploration Analog and Simulation, 2013-17, NASA)、最大12ヶ月
  • MARS500 (Russian Institute for Biomedical Problems, 2010-11, ロシア)、5名を520日間
  • HERA (Human Exploration Research Analog, 2024-, NASA)、45日
  • CHAPEA (Crew Health and Performance Exploration Analog, 2023-), 宇宙船模倣空間で3名を378日
  • CHAPEAにも「今更やる価値は」批判
  • NASA宇宙システム部門副部長(Rachel MacCauley): 「精神安定のためにどれくらいスナックを載せる必要があるのかも技術計算に重要」

JAXA調査報告書 (2022年11月25日脚注3):

2014年に、分科会の意見に耳を傾けず有人部門のみの判断で、審査迅速化を目的に、評価要領が改訂され、分科会の進捗評価は(引用者追記: 不承認が削除され)継続妥当・見直し必要の2択となっていた。継続妥当となった場合でも多くの重要な指摘事項があったが、それらの指摘事項を担保する仕組みが無かった。

  • 有人技術宇宙部門 ⟵ 研究開発「倫理審査委員会」+有人サポート委員会宇宙医学研究推進「分科会」が審査
  • 有人技術宇宙部門 ⟶ 分科会の評価要領を改訂、不承認できなくさせる
  • 評価要領の改訂理由は「審査迅速化」、誰が承認したか報告書に記載なし

JAXA事件の特徴: 組織的な研究倫理審査の軽視

  • (2015年1月9日: 分科会不承認)
  • (2015年3月6日: 分科会不承認)
  • (2016年2月5日: 研究開始)
  • 2017年11月27日: データ取り違え事案
  • 研究倫理審査委員会+分科会: 「研究の適正性の検討が必要」と報告
  • 2018年10月: 研究実施主体の有人部門が調査開始
    • 2019年6月: JAXA職員Hに実験参加者Aから実験プロトコルからの逸脱者の連絡
  • 2019年7月: 有人部門が研究活動改善に向けたアクション・プラン作成
  • 2019年11月: 理事長が研究中止決定、有人部門長に成果とりまとめ、分科会評価と倫理審査委員会報告を指示
  • 2020年9月23日: 分科会+倫理審査委員会が理事長に対し「多数の研究倫理違反、研究遂行上不適切な事実、研究計画/手法上の問題に加え、データの改ざんが強く疑われる事実が判明」したため「調査の実施の検討が必要」と報告
  • 2021年3月-4月: 委託業者による調査
    • 2021年9月29日: 有人部門長決定による対策検討チームの聞き取りで職員Hが「外部通報を共有しなかった」と報告、有人部門が通報に関して調査開始
  • 倫理審査委員会が委託業者調査報告を審議、理事長に対し厚労相と文科相に報告、公表を提言
  • 2022年11月25日: 厚労相と文科相に報告書提出、報告書公開
    • 2022年11月25日: 実験参加者AがJAXAへメール通報「2019年にJAXA職員Hに連絡した」
    • 2023年4月28日: 「研究対象者からの連絡に基づく調査報告書」公表

最初の事案発生から研究中止まで2年、報告書公開まで5年

  • 報告書執筆者は第三者委員会ではありません

研究倫理審査委員会+分科会は繰り返し調査を要請

外部通報者への連絡も1年以上放置

経営者と管理職の弁

佐々木理事

JAXAがしっかり認識し、ルールを作ったことは間違いない。一方、研究者一人一人が理解すべきだったが、末端まで伝わっていなかった。教育、指導を働きかけねばならなかった。

  • 分科会評価要領で不承認判断を許さなかったのに「しっかり認識し、ルールを作ったことは間違いない」?

経営者と管理職の弁

有人宇宙技術部門小川事業推進部長(当該研究の研究実施責任者(古川宇宙飛行士)の上司)

JAXAとして、人の安全を守るという医学研究の理解度、練度が本当に低かったのでは。STAP問題があった時、(研究者は)自分のこととして納得しなければならなかったが、果たして医学研究ではどうだったか。深堀りして確認していなかったからこそ、この状態になった。今こそ振り返り、是正すべきだ

  • 有人部門が反対を無視して評価要領を変更したのは「医学研究の理解度、練度が本当に低かった」から?
  • 「今こそ振り返り、是正すべきだ」…他人事のような…

「JAXA事件の特徴: 組織的な研究倫理審査の軽視」という認識は当事者にない

経営者と管理職の弁

JAXA経営陣の説明

研究費は文科省科学研究費補助金(科研費)とJAXA予算を合わせ、約1億9000万円。佐々木理事はこの研究は成果として発表しておらず、特定不正行為には当たらないとした。その上で「研究計画が稚拙で、十分な科学的合理性がなかった。JAXAに医学研究の難しさの知見がなく、研究チームの人数が少なく体制を整えず、無理になってしまった。実験データが個人情報のためアクセスできる人を限ってしまい、周りが十分にチェックできなかった。国民の負託に応えられず、実験協力者の善意も裏切り深くお詫びする。一丸となって再発防止に取り組む」とした。

  • 成果公表しなければFFPではない、は誤解です。学会でも報告済み。

この指針は、我が国の研究者等 により実施され、又は日本国内において実施される人を対象とする生命科学・医学系研究 を対象とする。 厚労省「指針」第3「適用範囲」1「適用される研究」

経営者と管理職の弁

  • 科学的意義の低い研究と分科会が判断

最も問題なのは、科学的合理性のある研究計画が検討されておらず、かつ科学的に適切な方法で遂行されなかったことであり、またそのように努めなかったこと (調査報告書)

意義の低い研究の実施=研究倫理(Emanuel et al. 2, 3, 6)の逸脱

そう指摘をする分科会を沈黙させた組織運営

JAXA事件の組織的背景(報告書, p.30)

組織として閉鎖環境実験成果を出すことを目指す

  • 1985年から莫大な国費を用いてISS計画を推進
  • ISSでの成果の創出が有人部門にとっての優先事項となっていた
  • 2015年時点で、5年後の目指す成果の出口は「地上の閉鎖環境等における実証とISSにおける一部の検証を終え、火星に向けた研究を開始」すること
  • 2015年1月の第45回分科会(不承認)、第46回分科会(不承認)、同年9月第47回分科会(承認)、倫理審査委員会同年12月の第75回倫理審査委員会、2016年1月第76回倫理審査委員会(承認)

その担当者に非研究職(医師、宇宙飛行士)を任命、研究の実施と成果を求める

  • トップダウンのプロジェクト
  • 無理な業務命令なので末端が無理をしている

JAXA事件の組織的背景

2回も科学的意義で落第点

なのに無理やり実施: 経営者が無理解、提案者は忖度?恭順?

倫理審査委員会や分科会での指摘事項に十分応えることなく研究を進めようとした研究チームの不誠実な態度、それを容認してしまう倫理意識の欠如も背後要因となった。 調査報告書(p.19)

倫理審査委員会に提出した研究等実施計画書(第 3 回閉鎖試験)に「分科会において、妥当な計画であるとの評価を受けた」と虚偽の事実が記載されていた 同(p.22)

JAXA事件の組織的背景

FFについて:「専門家に任せる信頼の気持ちが勝ってしまった」ギフト・オーサーシップではないが、共著者なのに分担を超えて確認せず

研究体制の不備: 能力不足ならシニア研究者とペアにすべき

研究者としての適性を見極めず医師であることを理由に研究計画の策定から実行までを実施させた 同(p.24)

JAXA当事者はなぜFF(P)やRE違反をしたのか?

  • 非研究者なので研究倫理について考えていなかった
  • 経営者が非研究者(研究能力の乏しい人)に多額予算の研究を実施させ、成果を出させようとした(トップダウン)
  • 分科会審査という安全装置が外された(邪魔者扱い)
  • 人の配置、権限配分、予算、期間を経営者が考えていなかった
  • 経営者が研究の見識を(経営者に相応しいほど)持っていなかった

JAXA当事者はなぜFF(P)やRE違反をしたのか?

アジ研には研究倫理を尊重する文化があります

今年の研究成果に不安・不透明感を持つならば、早めに上長に相談しましょう

適度な競争や批判の圧力の下、若手を育てます

まとめ: 社会から託された信任を裏切らない

References