1. LLM評価で注意すべき過学習の問題

    [PROGRAMMING]

    大規模言語モデルやRAGの評価では、テストデータへの過学習により実運用で性能が落ちることがある。学習例の暗記に偏ると未知データへ一般化しにくくなるため、評価設計が重要だ。