skip_to_content
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 로고
  • 전체 기사
  • 🗒️ 회원가입
  • 🔑 로그인
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 개인정보처리방침 cookie_banner_and 쿠키 정책 cookie_banner_more_info

쿠키 설정

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

실업의 징후는 "게시물"에 나타난다 — SNS가 공식 통계보다 빠르게 경기 상황을 반영하는 날

실업의 징후는 "게시물"에 나타난다 — SNS가 공식 통계보다 빠르게 경기 상황을 반영하는 날

2026年01月01日 11:03

"통계보다 빠른 현실"은 어디에 있는가

실업률이나 실업 보험 신청과 같은 고용 통계는 경기의 체온계이다. 그러나 체온계는 측정하고 기록하며, 집계하여 발표되기까지 시간이 걸릴 수밖에 없다. 위기의 초기 단계일수록 그 "지연"은 아프다.


그렇다면, 공식 데이터 이전에 "실업의 징후"를 포착하는 방법은 없는가——연구자들이 주목한 것은 SNS에 흘러나오는 생생한 말들이었다. "일자리를 잃었다", "면접에서 떨어졌다", "직업 찾기가 힘들다". 그것들이 단순한 불평이 아니라, 경제의 "속보"가 될 수 있다는 것이다. Phys.org


연구의 요점: JoblessBERT가 한 일

이번 연구(PNAS Nexus)는 SNS 게시물 중에서 "실업의 자기 공개"를 AI로 찾아내고, 미국의 실업 보험 신청(UI claims)을 최대 2주 앞서 예측하는 틀을 제안하고 있다. 모델 이름은 JoblessBERT. BERT 계열의 Transformer 분류기를 실업에 관한 자기 신고 탐지에 특화하여 조정한 것이다. Phys.org


포인트는 두 가지가 있다.
(1) 게시물의 다양성을 놓치지 않는다: 속어, 오타, 부드러운 표현(예: "needa job" 같은 표현)까지 포착한다. 기존의 "특정 구문 75개를 포함하는가" 방식(규칙 기반)에 비해, 같은 정확도를 유지하면서 훨씬 더 많은 "실업 같은 자기 공개"를 찾는다. OUP Academic


(2) SNS의 편향을 보정하여 "지수"로 만든다: SNS는 모집단 자체가 아니다. 그래서, 추정한 사용자 속성과 인구조사의 인구 추계를 사용하여 게시자의 편향을 보정(포스트스트래티피케이션)하고 "Twitter 실업 지수"를 만들어 통계 모델에 넣는다. OUP Academic


어떤 데이터로 학습했는가

연구팀은, 2020년 1월~2022년 12월에 수집한, 미국 기반 31.5백만 명의 공개 게시물을 사용했다. 대상은 프로필 위치가 미국 내에 대응될 수 있는 사용자를 중심으로, 언급 관계 등으로 샘플을 확장하는 "눈덩이식(snowball)" 수집도 진행하고 있다. OUP Academic


더욱이, JoblessBERT 자체는 8,838건의 라벨링된 게시물로 훈련되었고, 액티브러닝(불확실한 게시물을 우선하여 추가 라벨링하는 절차)으로 성능을 다듬어 갔다고 한다. OUP Academic


"탐지가 뛰어나다"만으로는 부족하다: 대표성의 벽

SNS 데이터를 정책에 사용하려면, 최대의 적은 "편향"이다. 게시하는 사람, 하지 않는 사람. 특정 연령층이나 지역에 편중되는 이용 실태. 애초에 실업한 사람이 반드시 SNS에 말하는 것도 아니다.


연구는 이 점을 정면으로 다루고, 프로필 정보에서 연령·성별·위치를 추정하여 인구 통계에 맞추는 보정을 넣는다. 연령·성별의 추정에서는, 프로필 이미지나 메타데이터를 사용하는 심층 학습 모델을 사용했다고 한다(추정할 수 없는 경우는 결손 보완의 궁리도 넣는다). OUP Academic


여기서는 SNS 상에서도 찬반이 갈리기 쉽다. 나중에 다루겠지만, "정확도 향상을 위해 이미지에서 속성을 추정하는 것은 무섭다"는 반응이 나오기 쉬운 한편, "익명화·집계라면 공공의 이익이 크다"는 옹호도 생긴다.


정확도는 얼마나 올랐는가

논문은 먼저, 자기 공개 탐지의 성능을 비교하고 있다. 규칙 기반은 정확도(precision)는 높지만 재현율(recall)이 낮다. 한편 JoblessBERT는, 동일한 정도의 높은 정확도를 유지하면서, 재현율을 크게 개선하여, "기존의 약 3배의 관련 게시물을 포착한다"고 보고한다. 더욱이, 표현의 폭이 넓어짐으로써 "포착할 수 있는 사용자"가 늘어나, 실업자 샘플이 보다 대표적으로 되는 방향에 기여한다. OUP Academic


그리고 예측 면에서는, 실업 보험 신청의 공개 전(최대 2주 전)에 어디까지 맞출 수 있는지를 평가하여, 업계의 컨센서스 예측에 대해 RMSE를 54.3% 개선했다고 기록하고 있다. OUP Academic


코로나 초기의 "급증"을 먼저 감지할 수 있었다는 것이 의미하는 것

이 연구가 상징적으로 보여주는 것은 2020년 3월의 급변이다. 팬데믹 선언 직후의 주에, UI claims가 약 25만 건 규모에서 290만 건으로 급등한 국면에서, 컨센서스 예측은 급증을 거의 잘못 보았던 반면, SNS 지수를 넣은 모델은 급변을 "감지"하여 예측치를 크게 끌어올렸다. JoblessBERT 모델은 주의 끝의 이틀 전에 266만 건, 발표 전날에는 280만 건으로, 실적 290만 건에 상당히 가까워졌다고 한다. OUP Academic


여기서 중요한 것은, "SNS가 만능"이 아니라, **"위기의 초기 단계에서 효과적인 속보성"**이 입증된 점이다. 경기가 부드럽게 움직이는 평시보다, 단층이 들어가는 순간에 가치가 나타난다. 정책의 대응책(추가 급여, 지방자치단체 지원, 창구 강화 등)이 "1주일이라도 빨랐다면" 효과가 있는 국면일수록, SNS 유래의 신호는 매력적이 된다.


"전국"만이 아니다: 주·도시 레벨이라는 야심

고용의 고통은 전국 평균에서는 보이지 않는다. 산업 구조도, 임대료도, 이민 비율도 다르다. 논문은 주·도시 레벨에서도 모델을 평가하고, 서브내셔널한 모니터링의 가능성을 보여준다. Phys.org


만약 이것이 구현에 견딜 수 있다면, "어느 도시의 어느 업종에서 충격이 오고 있는가"를, 공식 통계보다 빨리 파악할 수 있을지도 모른다.


그러나 최대의 논점은 "감시"가 되지 않을까

SNS 반응으로 먼저 나오기 쉬운 것은 다음의 의문이다.

  • 실업의 "자기 공개"를 모으는 것은, 약해진 사람을 추적하는 것이 되지 않을까?

  • 속성 추정(연령·성별)을 이미지에서 수행하는 것은, 개인 식별로 이어지지 않을까?

  • 정부나 기업이 "편리하게" 사용하여, 지원이 아니라 선별에 돌지 않을까?


논문 측도, 이러한 우려를 고려하면서, **익명화된 신호에 대한 "책임 있는 접근"**이나, 플랫폼과의 연계, 규제의 형태까지 포함하여 논의하고 있다. 요컨대 "무엇이든 취할 수 있는" 상태가 아니라, 공공 목적에서, 프라이버시를 지키면서, 연구나 모니터링에 사용할 수 있는 체제가 필요하다는 입장이다. OUP Academic


플랫폼 의존이라는 현실: Twitter(X)라는 것의 약점

또 하나의 SNS적 지적은, "그것, Twitter(X)가 전제 아닌가?"라는 점. 이용자 층은 변화하고, API의 사양이나 취득 가능성도 흔들린다. 논문도 "특정 기간·특정 플랫폼에서의 실증"이라는 것을 강조하고, 만능 도구가 아니라 "적응 가능한 틀"로서 제시하고 있다. OUP Academic


즉, 미래에는 다른 SNS(Reddit, Threads, 지역 SNS 등)나, 다른 언어권으로 이식할 필요가 있다. 여기가 "연구로서 재미있다"는 한편, "정책 구현으로서는 어렵다"는 포인트이기도 하다.


SNS 상의 반응(자주 보이는 논점별 정리)

실제로 이 연구는, Phys.org의 공식 계정을 통해서도 소개되고 있으며, SNS 상에서 공유되는 유형의 화제가 되고 있다. LinkedIn


거기서 보이는(혹은 일어나기 쉬운) 반응을, 논점별로 정리하면 이렇게 된다.


1) 칭찬: "통계의 속보성이 올라가는 것은 공공의 이익"

  • "재해·팬데믹 같은 비상시에, 2주 앞당김은 크다"

  • "주나 도시 레벨에서 빨리 알 수 있다면, 지원이 제때에 도착한다"
    (연구가 "위기 시에 강하다"는 점과 일치) OUP Academic


2) 우려: "약자의 목소리를 '감시 데이터'로 만들지 말아라"

  • "실업의 게시물

← 기사 목록으로 돌아가기

문의하기 |  이용약관 |  개인정보처리방침 |  쿠키 정책 |  쿠키 설정

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.