- 영문명
- Leveraging LLM Hidden States for Offensive Text Detection : Frequency-Domain Signals versus. Semantic Vectors
- 발행기관
- 한국산업기술융합학회(구. 산업기술교육훈련학회)
- 저자명
- 황원용(Won-Yong Hwang) 김효관(Hyo-Kwan Kim)
- 간행물 정보
- 『산업기술연구논문지』제30권 3호, 69~78쪽, 전체 10쪽
- 주제분류
- 공학 > 산업공학
- 파일형태
- 발행일자
- 2025.09.30
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
최근 대형 언어 모델(Large Language Model, LLM)의 발전은 텍스트 생성과 이해 능력에서 주목할 만한 성과를 보여주고 있다. 하지만 이러한 모델들이 내부적으로 욕설이나 공격적 언어를 어떻게 표현하고 구별하는지는 아직 충분히 탐구되지 않았다. 본 연구는 모델의 출력 없이 내부 hidden state만으로 욕설 문장과 일반 문장을 구별할 수있는지 두 가지 접근법으로 비교하였다. 내부 hidden state에 대해 푸리에 변환(Fast Fourier Transform)을 적용하여 고주파 특성을 분석하는 주파수 기반 방법과 전체 토큰 hidden state의 평균을 벡터로 삼아 cosine 유사도로 문장을 판별하는 의미 기반 방법이다. 실험 결과 주파수 기반 방법은 분류 성능이 낮았으나, 의미 기반 접근은 명확한 분리 성능을 보여주었으며, 이는 LLM 내부 표현 공간에 공격성 정보가 내재되어 있음을 시사한다. 이 연구는 신호처리와 의미 표현 분석 간의 접점을 탐색하며, 사회 언어적 분류 문제에 대한 새로운 해석 가능성을 제시한다.
영문 초록
Recent advances in large language models (LLMs) have demonstrated remarkable capabilities in text generation and understanding. However, how these models internally represent and distinguish offensive or abusive language remains underexplored. This study investigated whether such language can be detected using only the internal hidden states of LLMs, without relying on the model's output. We compared two approaches: (1) a frequency-based method that applied fast Fourier transform (FFT) to the hidden state to extract high-frequency features, and (2) a semantics-based method that averaged all token hidden states into a single vector and classified sentences via cosine similarity. The frequency-based method yielded low classification performance; however, the semantics-based approach exhibited clear separation between classes, suggesting that LLMs encode implicit signals of verbal aggression in their internal representations. This study highlights the intersection between signal processing and semantic representation analysis, providing new perspectives for socially sensitive language classification.
목차
Ⅰ. 서 론
Ⅱ. 관련 연구
Ⅲ. 실험 개요
Ⅳ. 실험 결과
Ⅴ. 결 론
ACKNOWLEDGEMENTS
References
키워드
해당간행물 수록 논문
- 산업기술연구논문지 제30권 3호 목차
- The Effects of Collaborative Output Tasks on Second Language Grammar Learning : A Meta-Analysis
- Accuracy and Profile Analysis of Cylindricity Measurement Methods Using Coordinate Measuring Machines
- The Impact of Fintech Adoption on the Relationship between Outward FDI and Firm Performance
- 어떠한 부하에도 효율적인 새로운 1.0V CMOS Op-Amp의 설계
- 한국군 합성훈련환경(STE) 구축 요구사항 분석 및 설계
- 내연기관 점화 플러그 장착 깊이에 따른 배출가스 발생에 대한 실험적 분석
- 하이브리드 추정 모델을 활용한 자동차 후륜 토우 각도 K&C Steer 외란 보상 시스템의 개발
- PWM과 아날로그 디밍을 선택할 수 있는 비용 효율적이고 소형의 리니어 LED 드라이버의 구현
- 이방성 자성유전체 시트를 활용한 SAR 성능 개선 효과
- 사전학습 언어모델의 은닉 표현을 활용한 욕설 문장 탐지 : 주파수 특성과 의미 벡터 기반 비교 실험
- 니들 피닝에 의한 고장력강 용접부의 피로 강도 향상 및무해화 균열 크기 평가
- 풍동시험용 헬리콥터 복합재료 로터 블레이드 설계 및제작 공법에 관한 연구
- 개미취 열수 추출물이 천식성 염증 모델 유래 비장세포의 Th2 사이토카인 발현에 미치는 면역 조절 효과
- 디지털트윈 기반 반도체 칩 분류 시뮬레이터 개발 및 교육 효과 분석
- LPG 운반선 화물탱크용 LT FH32 강재의 용접부 특성에 미치는 용접기법의 영향
- 자율주행 로봇을 위한 확률기반 기법
- 고전적층판 이론에 의한 재료실험 및 카본시트로 구속된 원형 콘크리트 기둥의 압축강도 실험연구
- 선삭 가공 공정에서 단속 구간의 절삭 특성에 따른 공구 수명 평가
- 무인기 응용을 위한 YOLOv5 기반 실시간 장애물 인식 영상 처리 시스템 개발
- 인공지능 기반 단백질-리간드 상호작용 예측을 위한 신약 후보 물질 발굴 프레임 워크
- LNG 연료 기반 자동차 제조 공정의 에너지 효율 분석 모델(AL-EEM) 연구
- 현무암 섬유 강화 복합재의 탄도 저항성 및 파단 특성에 관한 연구
- 감정 분석 정확도 향상을 위한 솔루션의 제안
- 수냉각 하우징을 적용한 영구자석 동기전동기의 집중정수 열회로망 모델링 및 실험 검증
- 시멘트 고형화 처리법과 고로슬래그 미분말 및 플라이애시를 활용한 지정폐기물 비산재의 중금속 용출 저감 특성
- 피어싱 펀치의 형상 및 코팅유형이 전단가공에 미치는 영향에 관한 연구
- 국내 법률 LLM의 활용과 연구동향 : 환각과 보안 리스크를 중심으로
- 상장기업의 기부금 지출이 기업 이미지를 통한 기업성과에 미치는 영향 연구 : 기업 투명성 수준의 조절효과를 중심으로
- 디지털 트윈 좌표기반 가상 센서 스위칭 제어 연구
- PECVD 공정장비의 RPG 도파관 직경 최적화를 통한 NF 3 가스 사용량 절감 및 세정 효율 향상에 관한 연구
- 국제 경영환경에서의 공급망 디지털화와 기업성과 간 관계 분석 : 기술수용수준의 조절효과 중심으로
참고문헌
관련논문
공학 > 산업공학분야 BEST
- AI-교사 협력 모델을 통한 교육적 관계 분석 : 가상 시나리오 기반 연구
- 웹소설에 나타난 ‘회귀와 환생’의 욕망코드
- 노인의 여가만족과 사회적 건강이 주관적 건강상태에 미치는 영향
공학 > 산업공학분야 NEW
- 산업기술연구논문지 제30권 3호 목차
- The Effects of Collaborative Output Tasks on Second Language Grammar Learning : A Meta-Analysis
- Accuracy and Profile Analysis of Cylindricity Measurement Methods Using Coordinate Measuring Machines
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
