mesma interface não mais: ChatGPT, 웹 vs API, 뉴스 추천 '천차만별' 밝혀져¶
원제목: ChatGPT’s news picks swing wildly depending on whether you use the web interface or the API
핵심 요약
- ChatGPT는 웹 인터페이스와 API 접근 방식에 따라 뉴스 추천 결과가 크게 달라짐을 발견했음.
- 웹 인터페이스는 특정 언론사(Axel Springer 계열)에 편중되는 경향이 있었으며, API는 위키피디아와 같은 백과사전 및 덜 알려진 매체를 더 자주 인용했음.
- 다양한 출처를 요청해도 때로는 정치적으로 편향되거나 신뢰할 수 없는 사이트, 심지어 가짜 뉴스 사이트로 이어질 수 있음을 연구 결과가 경고했음.
상세 내용¶
함부르크 대학과 라이프니츠 미디어 연구소의 새로운 연구에 따르면, ChatGPT를 사용하는 방식에 따라 뉴스 추천 결과가 현저하게 달라지는 것으로 나타났습니다. 연구진은 5주 동안 독일어권 국가에서 뉴스 관련 질문에 대한 24,000개 이상의 AI 답변을 분석하여 웹 인터페이스와 API 간의 뚜렷한 차이를 발견했습니다.
연구팀은 일반적인 질문과 함께 다양한 출처의 정보를 요청하는 쿼리에 대한 ChatGPT의 응답을 비교했습니다. 그 결과, 사용자가 더 많은 다양성을 명시적으로 요청하지 않는 한, API는 백과사전이나 틈새 사이트와 같은 비언론 매체에 더 치우치는 경향을 보였습니다.
웹 인터페이스의 경우, OpenAI의 라이선스 파트너인 악셀 스프링어(Axel Springer) 계열의 매체들을 많이 추천했으며, 특히 벨트(welt.de)와 빌트(bild.de)와 같은 보수적인 타블로이드 스타일의 브랜드가 전체 인용의 약 13%를 차지했습니다. 그러나 API에서는 이들 사이트의 언급량이 2%에 불과했으며, 웹에서 최상위로 꼽혔던 이들 매체가 API에서는 각각 61위와 158위로 크게 하락했습니다.
반면, API는 위키피디아와 같은 백과사전(API 인용의 약 15%)이나 독일 내 인지도가 낮은 지역 매체들을 더 자주 언급하는 경향을 보였습니다. 예를 들어, Deutsche-handwerks-zeitung.de와 같은 사이트가 API 결과에서 훨씬 더 자주 나타났습니다. 로이터 디지털 뉴스 보고서 2025와 비교했을 때, 웹 인터페이스의 출처 목록은 독일 주요 언론과의 유사성이 45.5%인 반면, API는 27.3%에 그쳤습니다. 공영 방송 역시 웹 인터페이스(34.6%)보다 API(12.2%)에서 더 적은 노출을 보였습니다.
사용자가 더 광범위한 출처를 요청했을 때, API는 일반적인 쿼리보다 1.4배, 웹 인터페이스는 1.9배 더 많은 사이트를 나열했지만, 더 많은 다양성이 항상 더 나은 정보를 의미하는 것은 아니었습니다. 연구에 따르면, 이러한 요청은 러시아 정부와의 연계 보도가 있는 news-pravda.com과 같은 정치적으로 편향되거나 선전성 매체의 인용을 증가시켰습니다. 또한, 시스템이 news-site1.com과 같은 가짜 또는 존재하지 않는 도메인이나 AI가 작성한 '뉴스'를 생성하는 유사 사이트를 링크하는 경우도 있었습니다. 일부 출처가 논란의 여지가 있었음에도 불구하고, ChatGPT가 인용한 매체의 평균 정치적 성향은 국가 평균과 비슷했으며, 대부분의 출처는 7점 척도에서 3.89에서 3.98 사이의 점수를 기록하여 전반적인 인구와 유의미한 차이를 보이지 않았습니다. 그러나 연구진은 ChatGPT의 '다양성' 개념이 항상 실제 정보의 다양성을 의미하는 것은 아니며, AI가 주류 매체와 언어적으로 두드러지는 출처를 단순히 강조할 수 있다고 경고했습니다. 이 연구는 또한 ChatGPT의 내부 작동 방식에 대해 알려진 것이 거의 없다는 점을 강조하며, OpenAI가 웹 인터페이스와 API 간의 차이를 유발하는 원인을 설명하지 않아 사용자가 스스로 판단해야 한다고 지적했습니다. 연구진은 OpenAI가 시스템을 수시로 변경하므로 이러한 결과는 단지 특정 시점의 스냅샷에 불과하다고 덧붙였습니다. 이는 생성형 AI 검색 도구가 Google과 같은 기존 검색 엔진과는 매우 다른 출처에 의존하는 광범위한 추세에 부합합니다. 동시에, 주요 AI 시스템은 이제 1년 전보다 허위 정보를 퍼뜨릴 가능성이 두 배로 높아졌는데, 이는 사실이 불분명할 때 답변을 거부하는 대신 거의 모든 쿼리에 답변하기 때문입니다.
편집자 노트¶
이번 연구 결과는 우리가 AI, 특히 챗GPT를 통해 정보를 접하는 방식에 대한 근본적인 질문을 던지고 있습니다. 단순히 '웹 브라우저'로 접속하느냐, 아니면 'API'를 통해 프로그래밍 방식으로 접근하느냐에 따라 추천되는 뉴스의 출처와 성격이 극명하게 달라진다는 것은, AI가 일관된 기준으로 정보를 제공하지 않을 수 있음을 시사합니다. 이는 마치 같은 책을 읽어도 어떤 편집자가 엮었는지, 어떤 서점에서 구입했는지에 따라 다른 내용을 얻게 되는 것과 같은 이치입니다.
특히 주목할 점은 API 접근 시 백과사전이나 덜 알려진 매체의 인용이 늘어난다는 것입니다. 이는 개발자들이 AI 모델을 구축하거나 서비스에 통합할 때, 일반 사용자가 웹에서 접하는 것과는 다른, 어쩌면 더 '건조하고' 정보 중심적인 소스를 활용할 가능성이 있음을 보여줍니다. 반면 웹 인터페이스에서 특정 국내 언론사의 노출이 많아지는 현상은, AI 모델 학습 과정이나 수익 모델 등이 결과에 영향을 미칠 수 있다는 의혹을 제기합니다. 이는 AI가 순수하게 객관적인 정보 제공자라기보다는, 특정 이해관계의 영향을 받을 수 있다는 가능성을 열어둡니다. 이는 사용자가 AI의 답변을 비판적으로 수용하고, 다양한 출처를 교차 검증해야 하는 이유를 더욱 분명하게 합니다.