Exposing Long-Tail Safety Failures in Large Language Models through Efficient Diverse Response Sampling

Reviewed on OpenReview: https://openreview.net/forum?id=tHfAskovWI

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
LICENSE		LICENSE
MyGenerationMixin.py		MyGenerationMixin.py
PDPSampler.py		PDPSampler.py
README.md		README.md
modelling_llama.py		modelling_llama.py
modelling_qwen2p5.py		modelling_qwen2p5.py
modelling_qwen3.py		modelling_qwen3.py
pdps_attack.py		pdps_attack.py
pdps_utils.py		pdps_utils.py
utils.py		utils.py

Provide feedback