Safety, Evaluation & Applications

Evaluation frameworks, safety and bias analysis, robustness research, and downstream applications of text-to-image models.

⌘K

Evaluation, Safety, Bias & Robustness 25+ papers

Title	Focus	Venue	Year
Moonworks Lunara Aesthetic Dataset	Aesthetic Dataset	arXiv	2026
Moonworks Lunara Aesthetic II	Image Variation Dataset	arXiv	2026
YOLO-Count	Differentiable Object Counting for T2I Generation	arXiv	2025
Rich Human Feedback for T2I Generation (Best Paper)	Human Feedback	CVPR	2024
PopAlign	Population-Level Alignment for Fair Text-to-Image Generation	arXiv	2024
Fine-Grained Feedback	Untangling Challenges of Fine-Grained Feedback for T2I	arXiv	2024
OpenBias	Open-set Bias Detection in Text-to-Image Generative Models	CVPR	2024
SafeGen	Mitigating Unsafe Content Generation in Text-to-Image Models	arXiv	2024
DIAGNOSIS	Detecting Unauthorized Data Usages in T2I Diffusion Models	ICLR	2024
Spatial Consistency	Getting it Right: Improving Spatial Consistency in T2I Models	arXiv	2024
Learning Multi-dim Human Preference	Multi-dimensional Human Preference for T2I	CVPR	2024
HEIM	Holistic Evaluation of Text-To-Image Models	NeurIPS	2023
GenEval	An Object-Focused Framework for Evaluating Text-to-Image Alignment	arXiv	2023
HPSv2	Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences	arXiv	2023
ImageReward	Learning and Evaluating Human Preferences for Text-to-Image Generation	arXiv	2023
TIFA	Accurate and Interpretable Text-to-Image Faithfulness Evaluation with QA	arXiv	2023
LLMScore	Unveiling the Power of LLMs in Text-to-Image Synthesis Evaluation	arXiv	2023
ConceptBed	Evaluating Concept Learning Abilities of Text-to-Image Diffusion Models	arXiv	2023
IMMA	Immunizing T2I Models against Malicious Adaptation	arXiv	2023
Rickrolling the Artist	Injecting Backdoors into Text Encoders for T2I Synthesis	ICCV	2023
RIATIG	Reliable and Imperceptible Adversarial Text-to-Image Generation with Natural Prompts	CVPR	2023
Demographic Stereotypes	Easily Accessible T2I Generation Amplifies Demographic Stereotypes at Large Scale	FAACT	2023
DE-FAKE	Detection and Attribution of Fake Images Generated by T2I Diffusion Models	arXiv	2022
Cultural Bias	Exploiting Cultural Biases via Homoglyphs in Text-Guided Image Generation	arXiv	2022
Privacy Analysis	Membership Inference Attacks Against Text-to-image Generation Models	arXiv	2022

Applications & Downstream Tasks 15+ papers

Model	Full Title	Domain	Venue	Year
Acquire & Adapt	Squeezing out T2I Model for Image Restoration	Restoration	CVPR	2025
JarvisArt	Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent	Retouching	arXiv	2024
TextDiffuser	Diffusion Models as Text Painters	Text Rendering	arXiv	2023
GlyphDraw	Learning to Draw Chinese Characters in Image Synthesis Models Coherently	CJK Text	arXiv	2023
SegGen	Supercharging Segmentation Models with Text2Mask and Mask2Img Synthesis	Segmentation	arXiv	2023
ODISE	Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models	Segmentation	CVPR	2023
Image Super-Resolution	Image Super-Resolution with Text Prompt Diffusion	Super-Resolution	arXiv	2023
HAAR	Text-Conditioned Generative Model of 3D Strand-based Human Hairstyles	3D Hair	arXiv	2023
DiffUTE	Universal Text Editing Diffusion Model	Text Editing	arXiv	2023
Guiding T2I Towards Grounded Generation	Guiding Text-to-Image Diffusion Model Towards Grounded Generation	Grounding	arXiv	2023
CLIP Segmenter	CLIP is Also an Efficient Segmenter: A Text-Driven Approach for Weakly Supervised Semantic Segmentation	Segmentation	arXiv	2022
Peekaboo	Text to Image Diffusion Models are Zero-Shot Segmentors	Segmentation	arXiv	2022
AvatarCLIP	Zero-Shot Text-Driven Generation and Animation of 3D Avatars	3D Avatars	SIGGRAPH	2022
Text2Light	Zero-Shot Text-Driven HDR Panorama Generation	HDR Panorama	SIGGRAPH Asia	2022
DALL-E for Detection	Language-driven Context Image Synthesis for Object Detection	Detection	arXiv	2022