#python #data #research #healthcare #group
| 🗓️ | 2024년 5월 - 2024년 6월 |
| --- | ----------------------------------------------------------------------------------------------------------------------------------------------------------- |
| 팀 | Hyseung Kim, Jisu Yoon, Youjee Oh |
| 담당 | - Hyseung: 리서치, 크롤링, 데이터 분석, 발표<br>- Jisu: 리서치, 크롤링, 데이터 분석, 통계<br>- **Youjee: 리서치, 크롤링, 데이터 분석, 통계, 데이터 시각화** |
| 소개 | 디자이너의 직관에 의존하기보다 데이터를 기반으로 객관적으로 문제를 파악하는 것을 목적으로 한 프로젝트. 데이터 기반 서비스 디자인 수업의 일환으로 진행되었으며, Python을 활용해 유튜브 텍스트 데이터를 크롤링하여 정신 건강(Mental Healthcare)에 대해 조사했다. |
국내 중증 정신질환자 규모가 2013년 14.3만 명에서 2019년 17.5만 명으로 증가하며, 연평균 3.4% 증가하고 있다. 정신건강 중증질환 진단 연령이 낮아지고 있으며, 질환 별로 양극성 정동장애(조울증)가 다른 질환에 비해 10.2%로 증가했다. 특히 전 세계적으로는 청소년들의 심리적 고통이 증가했다. 전 세계 10~19세 청소년 중 최소 13%가 정신 건강 장애 진단을 받는 것으로 나타났다.

이처럼 현대인들의 정신 건강 장애는 계속해서 증가하고 있다. 우리는 사람들이 어떤 종류의 정신 건강 문제를 경험하고 있는지, 정신질환에 대한 인식과 문제의식이 어떠한지를 파악하고 분석하기로 했고, 유튜브의 텍스트 데이터를 리서치 기반으로 활용했다.
팀은 세 명으로 구성되었으며, 이 프로젝트는 데이터 기반 서비스 디자인 수업에서 진행되었다. 모든 팀원이 데스크 리서치부터 데이터 분석까지 모든 과정에 참여했고, 각자의 역할을 분담하여 진행했다.
<br>
#### Desk Research
데스크 리서치를 통한 트렌드 분석

트렌드 분석을 기반으로 한 사람 중심 사고(Human centered thinking).

**데스크 리서치를 진행한 결과**, 정책과 인식은 국가별로 다를 것이라고 예측되었다. 글로벌 단위로 텍스트 데이터를 수집하는 것은 범위가 넓고 시간이 많이 소요될 것으로 보였기 때문에, 조사 범위를 국내로 좁히기로 결정했다.
다음 단계는 ==**정신질환과 정신 건강 케어에 대한 다양한 관점을 파악하는 것**==이었고, 이를 위해 유튜브 영상을 선정하여 1만 개 이상의 댓글을 수집했다.
<br>
**유튜브 선정 기준**
1. 정신질환과 정신 건강에 대한 사람들의 다양한 시각을 파악하기 위해, "정신 건강", "우울증", "현대인의 정신질환", "정신질환 범죄", "현대인의 스트레스", "정신질환의 종류", "정신질환 인식" 같은 키워드로 검색했다.
2. 경증 정신질환과 중증 정신질환을 모두 고려해 데이터를 수집함으로써, 어느 한쪽에 치우치지 않도록 했다.
3. 최근 4년 이내에 업로드되었으며, 댓글이 최소 200개 이상인 영상을 선정하였다.
4. 다양성을 확보하기 위해 채널이 중복되는 것을 피했다.
5. 정신 건강과 정신질환에 대한 의견이나 인식이 드러나는, 댓글 수가 많은 영상을 우선적으로 선정했다.
<br>
**선정된 유튜브 영상**
- [정신건강특집] 우리는 왜 불안할까? 불안장애의 실체와 치료법 | 불안장애 연구의 세계적인 권위자 보르빈 반델로 강의 몰아보기 (10개월 전) [링크](https://www.youtube.com/watch?v=HPkfrbst_10)
- 정신과 상담 고민이신 분들 필수 시청!🤔 정신과 비용, 보험, 항우울제 등 정신과에 관한 모든 걸 알려드립니다 👨⚕️[양브로의 정신세계] (11개월 전) [링크](https://www.youtube.com/watch?v=dH3dUtbzpUA)
- 우울증을 겪고 있는 것은 당신의 탓이 아닙니다. 의지나 정신력으로 극복 불가한 우울증, 주변 사람이 "절대" 말하면 안 되는 금기어! [건강 읽어드립니다] | 노규식 박사 (2022. 9. 16.) [링크](https://www.youtube.com/watch?v=JQT1xFBtDE8)
- 사람들이 잘 모르는 우울증 환자 감정의 실체! 정신과 의사가 알려드립니다 (2022. 9. 30.) [링크](https://www.youtube.com/watch?v=MZBTIt_lkwM)
- 성인 ADHD 80%는 다른 정신질환을 동반한다 | ADHD 환자의 경험 | 씨리얼 시선 (2021. 7. 14.) [링크](https://www.youtube.com/watch?v=LptT728hqOc)
- 정신과 의사가 알려주는 경계선 지능의 오해와 진실 (2022. 9. 23.) [링크](https://www.youtube.com/watch?v=_Z3B30lI9eg)
- [고민사연] 의사에게 물어봤습니다. '우울증' 환자와 결혼해도 될까요? (2022. 4. 28.) [링크](https://www.youtube.com/watch?v=ZYnTwSsw3Qk)
- "우울증 아니다" 2030에서 급증하고 있는 정신질환 (2022. 5. 26.) [링크](https://www.youtube.com/watch?v=FXsSrzy6JZY)
- 대한민국 우울증 OECD 1위 (2022. 3. 15.) [링크](https://www.youtube.com/watch?si=eQ6xe5mk6T5gZSrn&v=SXl_pnG0j94&feature=youtu.be)
- [홍혜걸의 인사이트 인터뷰] #12 조현병과 강박증에 대한 통찰 (서울대병원 권준수 교수 & 의학전문기자 홍혜걸) (2021. 6. 26.) [링크](https://www.youtube.com/live/i9peTnVxMeg)
- 당신은 정말 ADHD인가? 뇌과학자가 정신질환 속 살아남는 방법 (2021. 12. 6.) [링크](https://www.youtube.com/watch?v=_zsv7nig9FA)
- 다큐 시선 - 우리는 조현병 당사자입니다 (2019. 6. 27.) [링크](https://www.youtube.com/watch?v=d6hsrARS-oYㅅ)
<br>
##### 텍스트 데이터 크롤링
데이터 분석에 활용하기 위해 답글을 포함하여 총 10,032개의 댓글을 크롤링했다.

댓글에서 추출한 단어들의 맞춤법, 띄어쓰기, 표현이 다양했기 때문에, 이를 표준화하고 같은 의미의 단어들을 통합하며 불용어를 제거해야 했다.
1. 띄어쓰기 통일
불안장애 = 불안 장애
공황장애 = 공황 장애
정신과 치료 = 정신과치료
우울증 = 우울 증
불안 요소 = 불안요소
약물치료 = 약물 치료
자살 시도 = 자살시도
정신과 병원 = 정신과병원
ADHD = adhd = Adhd
경계선지능장애 = 경계선 지능 장애
경계선지능 장애 = 경계선 지능
알콜중독 = 알콜 중독
심각한 경쟁 = 심각한경쟁
조현병 환자 = 조현병환자
정신건강 = 정신 건강
우울증 환자 = 우울증환자
우울 상태 = 우울상태
사회생활 = 사회 생활
심리치료 = 심리 치료
정신질환 = 정신 질환
정신과 의사 = 정신과의사
정신과 병원 = 정신과병원
정신 병원 = 정신병원
2. 단어 통일
자살률 = 자살율
경계선지능장애 = 경지
한국 = 대한민국
무기력 = 무기력증
정신과 = 정신병원
조울증 = 양극성장애
3. 불용어 선정
비누
감사합니다
말거라
좋겠어요
궁금하면
되요
해보셨나요
끼리
왔니
찾아보고는
려고
하는거
아님
아니잖아
재민
맞냐
보여주는건데
시키려고
힘내세요
난가
그냥
아닐까
하지말자
헷갈리게
쉽게
없으니
모르시면
제발
만들어라
보이는
여러
다르지
댓글
사네
찾아봐
저런거
시키면
걸리는
이었습니다
않나요
이런건
아니냐
본적
하는게
팔이
너무
알아서
많네요
해주면
잖아
망구
보면
...
4. 형태소 사전에 신조어 추가
듄 = EBS
가스라이팅
인싸
아스퍼거
에이디에이치디 = adhd
엠지 = mz
자살 = ㅈㅅ
5. 형태소 분석

<br>
### 텍스트 데이터 분석
**앞선 과정을 통해 정리된 총 7,544개의 댓글을 대상으로 분석을 진행했다.** 댓글들은 4개 섹션에 걸쳐 5개 토픽으로 분류된 것을 확인할 수 있다.


다섯 개 토픽에 대한 주요 키워드, 비율, Coherence Score(주제 일관성 점수)를 정리한 결과,
**Topic1과 Topic5**가 가장 높은 일관성 점수와 비율(토픽별 문서 분포)을 보였다. 따라서 분석에서는 Topic 2, 3, 4보다 Topic 1과 5에 더 집중했다.

각 토픽의 키워드별 Perc_contribution 점수와 관련 댓글들을 참고해 토픽 인사이트를 도출했다. 점수가 높을수록 키워드를 뒷받침하는 더 적합한 댓글이라는 의미이므로, 각 토픽 별로 가장 관련성이 높은 댓글에 집중하여 분석할 수 있었다.

<br>
#### 데이터 시각화
분류된 인사이트들을 비교하고 통합하여 핵심 발견점을 시각화했다.

1. 예상과 달랐던 결과는, **사회적 시스템보다 개인적인 이야기가 훨씬 더 많이 언급되었다는 점**이었다.
<br>
---

2. 사람들은 자신의 경험에 대해서는 불확실한 어조로 말하는 반면, **타인의 경험은 훨씬 더 단정적으로 공유하는 경향**이 있었다.
<br>
---

3. 정신과 진료에 대한 인식은 긍정적 의견(17%)과 부정적 의견(10%)이 비슷한 균형을 이루었으며, 중립적 응답이 가장 많았다. 이러한 경우 사람들은 주로 자신의 개인적인 경험을 공유하는 데 초점을 맞추는 경향이 있었다.
<br>
---

4. 정신질환에 관한 댓글은 부정과 긍정으로 극명히 양극화되어있었다. 부정적인 댓글은 주로 다른 사람들의 이야기였고, 긍정적인 댓글은 자신의 개인적인 경험을 공유하거나 응원의 말을 전하는 경우가 많았다.
<br>
---

5. 정신질환의 종류에 따라 긍정/부정 댓글이 다르게 나타났다. 조현병, 우울증, 경계선 지능 장애에는 주로 부정적인 댓글이 달린 반면, ADHD는 눈에 띄게 더 긍정적인 어조를 보였으며, 자신의 경험을 공유하거나 잘 알려진 공인을 언급하는 경우가 많았다.
<br>
---

6. 추가 리서치를 진행해본 결과, 정신 건강 문제를 경험한 사람들 중 정신 건강 플랫폼을 이용한 사람은 18%에 불과했다. 도움을 구하지 않는 가장 큰 이유는, 자신의 상태가 치료가 필요할 만큼 심각하지 않다고 믿는 것이 우세했다.
---
#### Insight
**정신질환에 대한 부정적인 시각은 대부분 타인이 그것을 어떻게 보는지와 관련이 있었다.**
자신의 경험에 대해, 사람들은 종종 본인의 사연을 공유하거나 지지와 공감을 표현하며 더 긍정적인 관점을 보였다. 반면, 타인의 정신질환에 대해서는 자신과는 무관한 일이라고 느끼기 때문인지 부정적으로 보는 경우가 많았다.
또한 사람들은 자신이 겪는 정신질환 증상에 대해 이야기할 때 불확실한 표현을 사용하는 경향이 있었다. 추가 리서치 결과, 정신 건강 문제를 경험할 때조차 정신 건강 서비스를 이용하는 비율은 매우 낮은 것으로 나타났다. 그러나 타인의 증상에 대해 이야기할 때는 더 직접적으로 말하고, 성급한 판단을 내리거나 일반화하는 경우가 많았다.
결과적으로, 현대인들이 자신의 정신 건강을 정확히 이해하지 못할 수 있으며, 타인이 자신을 어떻게 볼지 두려워하고 있다는 것을 추론할 수 있었다.
이로부터 다음과 같은 문제 제기에 도달하였다.
**현대인들은 자신의 정신 상태를 명확히 이해할 필요가 있다.**
ADHD, 우울증, 편집증은 개인이 인지하거나 인정하지 못한 채 겪을 수 있는 정신질환의 예시이다.**자신의 문제가 아니라고 생각하기 때문에**, 공감이 부족하고 정신질환을 부정적으로 보는 경우가 많았다.
그러나 정신질환은 **많은 현대인들이 실제로 경험하고 있는 문제이며, 그 유병률은 점점 증가하고 있다. 본인을 보함한 누구나 겪을 수 있는 상태임을 더 많은 사람이 인식하게 된다면**, 부정적인 시각도 줄어들고, 치료를 받기 위한 장벽도 낮아질 수 있을 것이다.
---
우리는 유튜브 텍스트 데이터를 기반으로 정신질환에 대한 관점과 인식의 차이를 분석했다. 데이터가 유튜브에 한정되어 있다는 한계는 있지만, 글로벌 단위로 조사를 확장한다면 국가별로 다른 인사이트를 얻을 수 있을 것으로 기대된다.
특히 한국에 비해 심리 상담의 진입 장벽이 낮은 미국의 경우, 시스템과 대중의 인식 차이를 비교해보는 것도 흥미로울 것이다.
분석을 바탕으로 디자인 솔루션을 도출하는 과정은 이번 프로젝트에 포함되지 않았다. 대신 텍스트 데이터의 처리와 분석에 초점을 맞췄으며, 이것이 이 프로젝트의 주요 목표였다.