뒤로 가기

솔트룩스, 생성형 AI 윤리 연구로 세계 최고 학회 논문 6편 발표

2025-12-24


 

풀스텍 AI 기업 솔트룩스(대표 이경일)가 '사회적ㆍ윤리적 학습을 위한 데이터 특성 및 생성 AI 모델의 윤리성 향상 연구' 과제를 주관하며, 건국대학교ㆍKAISTㆍ성균관대학교ㆍ서강대학교 등의 대학 기관과 함께 우수한 학술 성과를 거두고 있다고 밝혔다. 솔트룩스 컨소시엄은 최근 언어 공학 분야 상위 0.2% 저널인 TACL(Transactions of the Association for Computational Linguistics)을 비롯해 세계 최고 수준의 국제 학회인 ACL, EMNLP, COLING, NAACL 등에서 총 6편의 논문을 발표ㆍ게재하며 연구 경쟁력을 입증했다.

 

최근 생성형 인공지능은 일상생활 전반에 빠르게 확산하고 있지만 허위 정보 생성, 편향, 공격적 발화 등 사회적ㆍ윤리적 문제가 함께 대두되고 있다. 이에 솔트룩스는 대학 연구진과 협력해 생성형 AI의 사회적 신뢰성과 윤리성을 높이기 위한 학습 데이터 구축, 생성형 AI 학습 방법 등의 기술 연구를 수행하고 있다.

 

대표적으로 ACL 2025에서 발표된 'Small Changes, Big Impact' 논문은 LLM 내부의 소수 뉴런만 조작해도 모델의 공격성이 크게 변한다는 사실을 실증해 주목받았다. 연구진은 공격성 관련 뉴런을 식별한 뒤 활성화ㆍ비활성화를 시도했고, 그 결과 모델의 공격적 응답 비율이 최대 33%까지 증가하는 등 예상보다 큰 영향력이 확인됐다. 이는 출력 단계의 필터링만으로는 안전성과 윤리성을 충분히 보장하기 어렵다는 점을 보여주며, 뉴런 단위의 내부 구조 분석이 LLM 안전성 및 윤리성 확보에 핵심적임을 시사한다.

 

이와 함께 솔트룩스 컨소시엄은 올해 현재까지 국제 특허 등록 1건 및 출원 1건, 국내 특허 등록 1건 및 출원 7건 등 다양한 연구 성과를 달성했다. 또한 12월 말에는 연구를 통해 개발한 학습 데이터와 소스코드를 공개해 국내외 연구자들이 활용할 수 있도록 지원할 계획이다.

 

김재은 솔트룩스 최고기술책임자(CTO)는 "TACL, ACL, EMNLP는 전 세계 AI 연구자들이 가장 주목하는 학회"라며 "이번 논문 연속 발표ㆍ게재는 솔트룩스 산학 연구팀의 생성형 AI 윤리 기술이 세계적으로 학문적 검증을 받았다는 점에서 큰 의미가 있다"고 말했다.

 

한편, 이번 연구는 과학기술정보통신부와 정보통신기획평가원(IITP)이 지원하는 국가 AI R&D 사업의 일환으로 수행되고 있으며, 솔트룩스 컨소시엄은 앞으로도 사회적 가치와 책임성을 갖춘 AI 기술 개발과 학술 확산을 지속할 계획이다.

 

본 연구는 2025년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행됐다.


 

 

###


관련기사 : 뉴스로드

목록으로 가기