Krytyka badań Reinhart i Rogoffa pokazuje największą zaletę nauki

Anglojęzyczne media biznesowe i anglojęzyczna blogosfera ekonomiczna od wtorku żyją krytyką bardzo znanych badań makroekonomicznych Reinhart i Rogoffa (dalej: R&R), Growth in a Time of Debt z 2010 roku, w których autorzy argumentowali, że wysoki dług publiczny (jako odsetek PKB) i niski wzrost gospodarczy są ze sobą powiązane a związek ten jest szczególnie widoczny po przekroczeniu przez dług granicy 90% PKB.

Badania te wykorzystywano w wielu dyskusjach ekonomicznych i politycznych jako argument na rzecz przeprowadzenia cięć budżetowych w celu obniżenia poziomu długu publicznego. Warto przy tym zaznaczyć, że w dyskusjach politycznych z reguły wyciągano kompletnie nieuprawniony wniosek z badań R&R sugerując, że wysoki dług publiczny JEST PRZYCZYNĄ niskiego wzrostu gospodarczego. Badania R&R nie zawierały takiej hipotezy choć sami autorzy badań w tekstach publicystycznych takiego argumentu używali.

We wtorek opublikowano badania Herndona, Asha i Polina (dalej: HAP), które podważyły wyniki badań R&R. Konkretnie autorzy krytycznych badań pokazali, że po wyeliminowani błędów z badań R&R postulowana przez nich średnia zmiana PKB dla państw z długiem publicznym powyżej 90% PKB w badanej przez nich grupie państw i okresie wynosi nie -0,1% lecz 2,2%.

R&R popełnili zdaniem HAP trzy podstawowe błędy:

  • zrobili prosty błąd w Excelu – nie przeciągnęli formuły na wszystkie wiersze w kolumnie i pominęli część państw przy obliczaniu średniej
  • odrzucili bez wyraźnego powodu część dostępnych danych (na przykład dla Nowej Zelandii z pięciu lat, które spędziła w grupie państw z wysokim, powyżej 90% PKB, długiem wybrali jeden rok ze spadkiem PKB na poziomie -7,6 podczas gdy średnia dla wszystkich pięciu lat to 2,6%
  • stosowali kontrowersyjny system ważenia – dane dla poszczególnych państw ważyli jednakowo niezależnie od tego ile lat państwa w danej kategorii (średnia dla Wielkiej Brytanii, która w kategorii państw z dużym wysokim długiem spędziła 19 lat miała taką samą siłę jak średnia dla Nowej Zelandii, która według R&R w kategorii tej spędziła jeden rok)

Po uwzględnieniu tych błędów okazało się, że przeciętna zmiana PKB nie spada z 2,8% dla państw z długiem publicznym od 60% do 90% PKB do -0,1% dla państw z długiem publicznym powyżej 90% PKB, lecz spada z 3,2% na 2,2% a wielkość tego spadku nie jest statystycznie istotna. W badaniu, HAP, nie znaleźli także potwierdzenia, że poziom zadłużenia na poziomie 90% PKB jest punktem przełomowym.

Nie opisywałem na swoim blogu badań R&R ponieważ uznałem, że niewiele wnoszą do dyskusji o długu publicznym. R&R zignorowali bowiem najbardziej istotny problem – czy to wysoki dług powoduje niski wzrost gospodarczy czy wręcz przeciwnie to niski wzrost gospodarczy (albo recesja) powoduje wysokie zadłużenie. W gruncie rzeczy możemy sobie wyobrazić sytuację, w której trzeci czynnik, na przykład starzenie się społeczeństwa, kurczenie się siły roboczej i wzrost liczebności populacji emerytów, powoduje zarówno niski wzrost gospodarczy jak i wysokie zadłużenie.

Dlatego w kontekście badań R&R i krytyki tych badań przez HAP chciałem zwrócić uwagę na coś innego. Reinhart i Rogoff to para bardzo utytułowanych ekonomistów z bardzo prestiżowego uniwersytetu (Harvard), mających w swoim życiorysie wiele osiągnięć (Rogoff jest szachowym arcymistrzem) i wiele odpowiedzialnych stanowisk.

Wiecie kto odkrył błąd w ich badaniu?

28-letni uczestnik studiów doktoranckich na University of Massachusetts.

W ramach zajęć z ekonometrii Herndon miał za zadanie powtórzyć badania R&R. Nie był w stanie osiągnąć tych samych rezultatów co autorzy i za namową swoich akademickich opiekunów (współautorów artykułu) zwrócił się do R&R o udostępnienie bazy danych. Ci nie odmówili i w czasie analizy oryginalnej bazy danych HAP odkryli błędy i kontrowersyjne techniki badawcze stosowane przez R&R.

Od dwóch dni praktycznie całe środowisko akademickie i cały świat finansów zajmują się artykułem HAP i odpowiedziami R&R na ten artykuł (tutaj pierwsza reakcja).

Z przedstawionej historii można wyciągnąć wiele cennych wniosków o ograniczeniach współczesnej nauki, w tym makroekonomii i o tym jak można zwiększyć efektywność Akademii. Oczywiście, jest to także kolejne przypomnienie o ograniczonej użyteczności badań empirycznych w makroekonomii.

Z mojego punktu widzenia, historia artykułu R&R i krytycznego artykułu HAP pokazuje coś znaczenie ważniejszego – Akademia czy nauka dysponuje mechanizmem auto-korekcyjnym. Nie jest on doskonały. W przypadku tak popularnych badań jak R&R proces trwał trzy lata.

Rzecz w tym, że mechanizm istnieje. Doktorant z Excelem może sprawdzić i sfalsyfikować rezultaty badań pary utytułowanych naukowców.

Na tym polega przewaga metody naukowej nad wszelkimi alternatywnymi systemami gromadzenia wiedzy. Gdy ktoś powie, że z dostępnych danych X można wyciągnąć wniosek Y to hipotezę tę można zweryfikować.

Ten wpis został opublikowany w kategorii Gospodarka/Finanse, Społeczeństwo i oznaczony tagami , , , , , . Dodaj zakładkę do bezpośredniego odnośnika.

14 odpowiedzi na Krytyka badań Reinhart i Rogoffa pokazuje największą zaletę nauki

  1. anonim pisze:

    Być może sprawdzenie tez R&R zabrało 3 lata, ponieważ czasopismo, a przynajmniej ten konkretny numer, w którym opublikowali swój artykuł, nie było objęte rygorem peer review. Tutaj więcej na ten temat: http://www.businessinsider.com/editor-talks-reinhart-rogoff-excel-error-2013-4

  2. Łomato!
    To w artykułach będacych obiektem kilkuletniej dyskusji „poważnych” ekonomistów obliczenia wykonuje się w Excelu? Nie zatrudnia się profesjonalnych statystyków? Nie trzeba się szarpnąć na wykupienie rocznej licencji pakietu statystycznego za 100$? Nikt tego nie recenzuje? Nie udostępnia się Raw-Data?

    O tempora o mores…

    • Trystero pisze:

      @ Globalny Śmietnik

      Z zatrudnianiem statystyków chyba przesadziłeś ale fakt, że liczono to w Excelu pewnie zdeterminował taki a nie inny sposób liczenia (arbitralne przedziały wzięte z powietrza).

      To był chyba artykuł z konferencji, który ukazał się w jedynym wydaniu prestiżowego periodyku, w którym nie stosowano recenzji.

      Nie zamierzam bronić R&R ale nie lubię też pisać rzeczy w rodzaju „to był bardzo słaby artykuł” nawet wtedy gdy uważam, że to był bardzo słaby artykuł.

      • Trystero pisze:

        @ Globalny Śmietnik

        Jednak, gdy porównasz standardy w artykułach z ekonomii czy innych nauk społecznych z tym co znasz z nauk ścisłych to reakcja „ło matko!” jest w pełni uzasadniona.

  3. Adam Duda pisze:

    Błędy są tak karygodne że aż intencjonalne. Przypominają mi włoskich naukowców którzy dla 5 min sławy ogłosili ze znaleźli lek na raka.

  4. Adam Duda pisze:

    ale to znani ludzie. Z autorytetem

  5. casualplayer pisze:

    R&R mogliby zastąpić Mishkina w Inside Job 2

  6. xxx pisze:

    @Adam Duda, anonim
    A taki Szczęśniak też jest przecież znany i uznawany za eksperta przez chyba wszystkie polskie media – mimo, że jego poglądy na naukę i metodę naukową są takie, że jego zdaniem peer review jest czymś za co naukowcy powinni się wstydzić ( http://www.trystero.pl/wp-content/uploads/2012/10/Kompr_html_mcf2b287.gif ).

  7. nexton pisze:

    Wypowiedzi naukowców są często obciążone błędami, a niekiedy emocjami lub intencjami. Pewnie częściej zdarza się to w naukach „miękkich” (jeśli je za nauki uznamy), rzadziej w ścisłych. Ekonomia jest nadal na pograniczu tych dwu typów. Jednak twierdzenia ekonomisty, jeśli poparte rachunkiem (choćby tylko excelowskim, lepiej, jeśli porządną statystyką czy ekonometrią) stają się falsyfikowalne, a więc – zgodnie ze stanowiskiem Poppera – naukowe. Można próbować je obalić, a dopóki to nie nastąpi, mamy prawo traktować je jako prawdziwe.

  8. blondynka pisze:

    no dajcie spokuj..nazywać te zabawy statystyką badaniami naukowymi..że niby co z nich wynika?..liczenie to nie jest myślenie..to chyba Teller powiedział że kryzys w fizyce jest skutkiem tego że skupia sie na gromadzeniu danych, przestała myśleć.

  9. Adam Duda pisze:

    blondynka… Są dwie fizyki, eksperymentalna i teoretyczna.. ta pierwsza skupia się na gromadzeniu danych. Także o co temu tellerowi chodziło?

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *