Makale, Noam Chomsky'nin istatistiksel öğrenme yöntemlerine yönelik eleştirilerini ve bu eleştirilere Peter Norvig'in yanıtını inceliyor. Chomsky, makine öğrenimi araştırmacılarının dünyadaki davranışları taklit etmek için yalnızca istatistiksel yöntemler kullanmasını, ancak bu davranışın anlamını anlamaya çalışmamasını eleştiriyor. Ona göre, bu tür bir "başarı" analiz edilmemiş verileri yaklaşık olarak tahmin etmekten ibaret olup, bilim tarihinde yeni ve sorgulanabilir bir başarı tanımı sunuyor. Bu eleştiriler, Steven Pinker'ın olasılıksal modellerin başarısı hakkındaki sorusuna yanıt olarak ortaya çıkmıştır.
Norvig, Chomsky'nin eleştirisine karşı çıkarak, istatistiksel ve eğitilmiş modellerin bilimdeki yaygınlığını ve başarısını vurguluyor. Örneğin, Claude Shannon'ın kelimelerin Markov zincirlerine dayalı olasılıksal iletişim modellerini ele alıyor; bu modellerin trilyonlarca parametreye sahip olabileceğini ve bu parametrelerin ancak verilerden istatistik toplanarak öğrenilebileceğini belirtiyor. Ayrıca, Newton'un kütle çekim yasası gibi temel fizik modellerinin bile, evrensel kütle çekim sabiti gibi değerlerin deneysel verilerden istatistiksel çıkarımla belirlenmesi nedeniyle "eğitilmiş" modeller olduğunu savunuyor.
Norvig, Chomsky'nin itirazının, Newton'un modelindeki gibi bir veya iki parametreye sahip istatistiksel modellerden ziyade, Shannon'ın modellerindeki gibi trilyonlarca parametreye sahip karmaşık istatistiksel modellere yönelik olduğunu öne sürüyor. Makale, bilimde "anlam" ve "veri yaklaşımı" arasındaki bu temel ayrımı ve istatistiksel yöntemlerin farklı bilim dallarındaki rolünü tartışarak, yapay zeka ve dilbilim alanındaki bu "iki kültür" arasındaki gerilimi aydınlatıyor.
Yapay zeka ve dilbilimdeki istatistiksel öğrenme yaklaşımlarının temelini ve sınırlamalarını, bilimsel modellerin doğası üzerine süregelen bir tartışma bağlamında ele alıyor.