Anglojęzyczne media biznesowe i anglojęzyczna blogosfera ekonomiczna od wtorku żyją krytyką bardzo znanych badań makroekonomicznych Reinhart i Rogoffa (dalej: R&R), Growth in a Time of Debt z 2010 roku, w których autorzy argumentowali, że wysoki dług publiczny (jako odsetek PKB) i niski wzrost gospodarczy są ze sobą powiązane a związek ten jest szczególnie widoczny po przekroczeniu przez dług granicy 90% PKB.
Badania te wykorzystywano w wielu dyskusjach ekonomicznych i politycznych jako argument na rzecz przeprowadzenia cięć budżetowych w celu obniżenia poziomu długu publicznego. Warto przy tym zaznaczyć, że w dyskusjach politycznych z reguły wyciągano kompletnie nieuprawniony wniosek z badań R&R sugerując, że wysoki dług publiczny JEST PRZYCZYNĄ niskiego wzrostu gospodarczego. Badania R&R nie zawierały takiej hipotezy choć sami autorzy badań w tekstach publicystycznych takiego argumentu używali.
We wtorek opublikowano badania Herndona, Asha i Polina (dalej: HAP), które podważyły wyniki badań R&R. Konkretnie autorzy krytycznych badań pokazali, że po wyeliminowani błędów z badań R&R postulowana przez nich średnia zmiana PKB dla państw z długiem publicznym powyżej 90% PKB w badanej przez nich grupie państw i okresie wynosi nie -0,1% lecz 2,2%.
R&R popełnili zdaniem HAP trzy podstawowe błędy:
- zrobili prosty błąd w Excelu – nie przeciągnęli formuły na wszystkie wiersze w kolumnie i pominęli część państw przy obliczaniu średniej
- odrzucili bez wyraźnego powodu część dostępnych danych (na przykład dla Nowej Zelandii z pięciu lat, które spędziła w grupie państw z wysokim, powyżej 90% PKB, długiem wybrali jeden rok ze spadkiem PKB na poziomie -7,6 podczas gdy średnia dla wszystkich pięciu lat to 2,6%
- stosowali kontrowersyjny system ważenia – dane dla poszczególnych państw ważyli jednakowo niezależnie od tego ile lat państwa w danej kategorii (średnia dla Wielkiej Brytanii, która w kategorii państw z dużym wysokim długiem spędziła 19 lat miała taką samą siłę jak średnia dla Nowej Zelandii, która według R&R w kategorii tej spędziła jeden rok)
Po uwzględnieniu tych błędów okazało się, że przeciętna zmiana PKB nie spada z 2,8% dla państw z długiem publicznym od 60% do 90% PKB do -0,1% dla państw z długiem publicznym powyżej 90% PKB, lecz spada z 3,2% na 2,2% a wielkość tego spadku nie jest statystycznie istotna. W badaniu, HAP, nie znaleźli także potwierdzenia, że poziom zadłużenia na poziomie 90% PKB jest punktem przełomowym.
Nie opisywałem na swoim blogu badań R&R ponieważ uznałem, że niewiele wnoszą do dyskusji o długu publicznym. R&R zignorowali bowiem najbardziej istotny problem – czy to wysoki dług powoduje niski wzrost gospodarczy czy wręcz przeciwnie to niski wzrost gospodarczy (albo recesja) powoduje wysokie zadłużenie. W gruncie rzeczy możemy sobie wyobrazić sytuację, w której trzeci czynnik, na przykład starzenie się społeczeństwa, kurczenie się siły roboczej i wzrost liczebności populacji emerytów, powoduje zarówno niski wzrost gospodarczy jak i wysokie zadłużenie.
Dlatego w kontekście badań R&R i krytyki tych badań przez HAP chciałem zwrócić uwagę na coś innego. Reinhart i Rogoff to para bardzo utytułowanych ekonomistów z bardzo prestiżowego uniwersytetu (Harvard), mających w swoim życiorysie wiele osiągnięć (Rogoff jest szachowym arcymistrzem) i wiele odpowiedzialnych stanowisk.
Wiecie kto odkrył błąd w ich badaniu?
28-letni uczestnik studiów doktoranckich na University of Massachusetts.
W ramach zajęć z ekonometrii Herndon miał za zadanie powtórzyć badania R&R. Nie był w stanie osiągnąć tych samych rezultatów co autorzy i za namową swoich akademickich opiekunów (współautorów artykułu) zwrócił się do R&R o udostępnienie bazy danych. Ci nie odmówili i w czasie analizy oryginalnej bazy danych HAP odkryli błędy i kontrowersyjne techniki badawcze stosowane przez R&R.
Od dwóch dni praktycznie całe środowisko akademickie i cały świat finansów zajmują się artykułem HAP i odpowiedziami R&R na ten artykuł (tutaj pierwsza reakcja).
Z przedstawionej historii można wyciągnąć wiele cennych wniosków o ograniczeniach współczesnej nauki, w tym makroekonomii i o tym jak można zwiększyć efektywność Akademii. Oczywiście, jest to także kolejne przypomnienie o ograniczonej użyteczności badań empirycznych w makroekonomii.
Z mojego punktu widzenia, historia artykułu R&R i krytycznego artykułu HAP pokazuje coś znaczenie ważniejszego – Akademia czy nauka dysponuje mechanizmem auto-korekcyjnym. Nie jest on doskonały. W przypadku tak popularnych badań jak R&R proces trwał trzy lata.
Rzecz w tym, że mechanizm istnieje. Doktorant z Excelem może sprawdzić i sfalsyfikować rezultaty badań pary utytułowanych naukowców.
Na tym polega przewaga metody naukowej nad wszelkimi alternatywnymi systemami gromadzenia wiedzy. Gdy ktoś powie, że z dostępnych danych X można wyciągnąć wniosek Y to hipotezę tę można zweryfikować.
Być może sprawdzenie tez R&R zabrało 3 lata, ponieważ czasopismo, a przynajmniej ten konkretny numer, w którym opublikowali swój artykuł, nie było objęte rygorem peer review. Tutaj więcej na ten temat: http://www.businessinsider.com/editor-talks-reinhart-rogoff-excel-error-2013-4
@ anonim
Dobre spostrzeżenie.
Tę informację zostawiłem na następny tekst: o tym jakie słabości nauki i ekonomii pokazuje R&R.
Łomato!
To w artykułach będacych obiektem kilkuletniej dyskusji „poważnych” ekonomistów obliczenia wykonuje się w Excelu? Nie zatrudnia się profesjonalnych statystyków? Nie trzeba się szarpnąć na wykupienie rocznej licencji pakietu statystycznego za 100$? Nikt tego nie recenzuje? Nie udostępnia się Raw-Data?
O tempora o mores…
@ Globalny Śmietnik
Z zatrudnianiem statystyków chyba przesadziłeś ale fakt, że liczono to w Excelu pewnie zdeterminował taki a nie inny sposób liczenia (arbitralne przedziały wzięte z powietrza).
To był chyba artykuł z konferencji, który ukazał się w jedynym wydaniu prestiżowego periodyku, w którym nie stosowano recenzji.
Nie zamierzam bronić R&R ale nie lubię też pisać rzeczy w rodzaju „to był bardzo słaby artykuł” nawet wtedy gdy uważam, że to był bardzo słaby artykuł.
@ Globalny Śmietnik
Jednak, gdy porównasz standardy w artykułach z ekonomii czy innych nauk społecznych z tym co znasz z nauk ścisłych to reakcja „ło matko!” jest w pełni uzasadniona.
Błędy są tak karygodne że aż intencjonalne. Przypominają mi włoskich naukowców którzy dla 5 min sławy ogłosili ze znaleźli lek na raka.
@ Adam Duda
Istnieje taki poziom natężenia niekompetencji, który wydaje się być intencjonalny, choć nie musi nim być.
ale to znani ludzie. Z autorytetem
@ Adam Duda
Na tyle na ile Cię znam bardzo trudno jest mi uwierzyć, że ostatnie zdanie nie jest ironią :)
R&R mogliby zastąpić Mishkina w Inside Job 2
@Adam Duda, anonim
A taki Szczęśniak też jest przecież znany i uznawany za eksperta przez chyba wszystkie polskie media – mimo, że jego poglądy na naukę i metodę naukową są takie, że jego zdaniem peer review jest czymś za co naukowcy powinni się wstydzić ( http://www.trystero.pl/wp-content/uploads/2012/10/Kompr_html_mcf2b287.gif ).
Wypowiedzi naukowców są często obciążone błędami, a niekiedy emocjami lub intencjami. Pewnie częściej zdarza się to w naukach „miękkich” (jeśli je za nauki uznamy), rzadziej w ścisłych. Ekonomia jest nadal na pograniczu tych dwu typów. Jednak twierdzenia ekonomisty, jeśli poparte rachunkiem (choćby tylko excelowskim, lepiej, jeśli porządną statystyką czy ekonometrią) stają się falsyfikowalne, a więc – zgodnie ze stanowiskiem Poppera – naukowe. Można próbować je obalić, a dopóki to nie nastąpi, mamy prawo traktować je jako prawdziwe.
no dajcie spokuj..nazywać te zabawy statystyką badaniami naukowymi..że niby co z nich wynika?..liczenie to nie jest myślenie..to chyba Teller powiedział że kryzys w fizyce jest skutkiem tego że skupia sie na gromadzeniu danych, przestała myśleć.
blondynka… Są dwie fizyki, eksperymentalna i teoretyczna.. ta pierwsza skupia się na gromadzeniu danych. Także o co temu tellerowi chodziło?