AI Safety Compendium

Home

❯

summaries

❯

DECEPTIONBENCH: A Comprehensive Benchmark for AI Deception Behaviors in Real world Scenario

DECEPTIONBENCH: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenario

27 Apr 20261 min read

DECEPTIONBENCH: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenario

Yao Huang, Yitong Sun, Yichi Zhang, Ruochen Zhang, Yinpeng Dong, Xingxing Wei — 2025-10-17

Source

Link: https://arxiv.org/pdf/2510.15501
Listed in the Shallow Review of Technical AI Safety 2025 under 1 agenda(s):
- ai-deception-evals — Evals

Related Pages

ai-deception-evals

Graph View

Graph view

The interactive citation graph is desktop-only. Visit this page on a larger screen to explore how concepts, agendas, papers, and organisations link together.

DECEPTIONBENCH: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenario
Source
Related Pages

Suggest a source
Connect
Overview
About (proof of concept)
Email feedback
Made by IT for Humanity

AI Safety Compendium

Explorer

DECEPTIONBENCH: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenario

DECEPTIONBENCH: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenario

Source

Graph View

Graph view

Table of Contents