P-hacking veri madenciliği kavramı, bilimsel araştırmanın belki de en çok konuşulmayan ama en yaygın sorunlarından birini tanımlar. İstatistiksel anlamlılık eşiği olan p < 0.05, araştırmacılar için bir kural değil bir hedef haline geldiğinde, veriler anlamlı sonuç çıkana kadar farklı biçimlerde işlenmeye başlar. P-hacking veri madenciliği şöyle işler: Bir çalışmada başlangıçta belirlenen analiz yöntemi anlamlı sonuç vermez. Bunun üzerine araştırmacı farklı alt grupları test eder, farklı kovaryantları dener, farklı istatistiksel yöntemler uygular. Sonunda p < 0.05 değeri elde edildiğinde bu analiz yöntemi "asıl yöntemmiş gibi" raporlanır. Diğer denemeler kayıt altına alınmaz. Bu pratiğin sonuçları ağırdır. Replikasyon krizi, pek çok alanda köklü bulguların tekrar denemelerde doğrulanamamasıyla gün yüzüne çıktı. Sosyal psikoloji, beslenme bilimi ve hatta tıp alanlarında uzun süre kabul görmüş bulgular sorgulanmaya başlandı. P-hacking veri madenciliği, bu krizin temel besleyicilerinden biridir. Sorun yalnızca kötü niyetli araştırmacılarda değildir. Yayın baskısı, "publish or perish" kültürü, anlamlı sonuç bulamamayı kariyer açısından riskli kılar. Dergiler, pozitif bulgulara çok daha kolay yer açar. Bu sistemik baskı, bireysel araştırmacıları etik açıdan gri bölgelere iter. Çözüm yolları tartışılmaktadır. Ön kayıt (pre-registration), araştırmanın başlamadan önce analiz planının kamuya açık bir platformda kayıt altına alınmasını gerektirir. Bu, sonradan yapılan analiz değişikliklerini şeffaf kılar. Replikasyon çalışmalarına verilen önemin artması, tek bulgulara dayalı sonuçların ağırlığını azaltır. P-hacking veri madenciliğine karşı en sağlam savunma, istatistiksel anlamlılığın ötesinde etki büyüklüklerini, güven aralıklarını ve pratik anlamlılığı birlikte değerlendiren bir okuma pratiğidir. Tek bir p değerine bakarak bir çalışmanın doğruluğunu yargılamak artık yeterli değildir.