검색결과 총 3건
-
AI 성능 넘어 '안전' 경쟁...KT 클라우드·카카오 AI 세이프티 맞손
[경제일보] 생성형 인공지능(AI)이 기업 업무 전반으로 확산되면서 AI 성능뿐 아니라 안전성과 신뢰성을 확보하기 위한 경쟁도 본격화되고 있다. 유해 콘텐츠 생성과 개인정보 유출, 프롬프트 공격 등 새로운 보안 위협이 부상하면서 AI를 실제 서비스에 적용하기 위해서는 'AI 세이프티'가 핵심 경쟁력으로 떠오른 것으로 분석된다. 26일 KT 클라우드와 카카오는 안전한 생성형 AI 서비스 구현을 위한 AI 세이프티 협력 체계를 구축했다고 밝혔다. 양사는 KT 클라우드의 AI 인프라 플랫폼과 카카오의 AI 세이프티 기술을 결합해 공공과 민간 분야에서 신뢰할 수 있는 AI 활용 환경을 구축한다는 계획이다. 최근 생성형 AI 도입이 빠르게 늘면서 AI 서비스의 안전성 확보가 기업들의 새로운 과제로 떠오르고 있다. AI가 허위 정보를 생성하는 '환각' 현상은 물론 '프롬프트 인젝션'을 통한 악성 명령 실행, 개인정보 유출, 유해 콘텐츠 생성 등의 위험성이 실제 서비스 운영 과정에서 잇따라 제기되고 있기 때문이다. 특히 공공기관과 금융권, 대기업을 중심으로 AI 도입이 확대되면서 모델 성능만큼 보안성과 신뢰성, 규제 대응 능력을 함께 검증하려는 움직임도 강화되고 있다. AI를 업무 시스템과 연계하는 기업이 늘어날수록 안전성을 확보할 수 있는 운영 체계가 필수 요소로 자리 잡고 있는 것이다. 이에 양사는 AI 서비스 개발부터 운영까지 전 과정에서 활용할 수 있는 AI 세이프티 기술 고도화에 나선다. 협력의 첫 단계로 KT 클라우드는 지난 4월 공개한 공공기관 대상 생성형 AI 플랫폼 'RAG Suite 2.0'에 카카오의 AI 가드레일 모델인 '카나나 세이프가드'를 적용할 예정이다. 카나나 세이프가드는 한국어와 국내 문화·법률 환경을 반영해 개발된 AI 세이프티 모델이다. 생성형 AI가 부적절하거나 유해한 답변을 생성하는 것을 방지하고 프롬프트 공격이나 정책 위반 가능성을 탐지하는 역할을 수행한다. 현재 카카오의 주요 AI 서비스에도 적용되고 있다. 양사는 가드레일 기술 적용을 시작으로 AI 모델 안전성 평가 시스템과 다양한 공격 시나리오를 기반으로 취약점을 점검하는 '레드티밍' 시스템도 단계적으로 제공할 계획이다. AI 모델이 실제 서비스 환경에서 예상하지 못한 공격이나 악용 시도에 얼마나 안정적으로 대응하는지를 검증하는 체계까지 함께 구축한다는 구상이다. 향후에는 AI 세이프티 도구를 통합 관리하는 운영 플랫폼 구축으로 협력을 확대한다. KT 클라우드 환경에서 축적되는 운영 데이터와 고객 피드백을 기반으로 AI 안전성 관리 기능을 고도화하고, 생성형 AI 서비스의 개발과 배포, 운영, 모니터링까지 아우르는 통합 운영 체계를 마련할 계획이다. IT 업계에서는 AI 시장 경쟁이 모델 성능 중심에서 안전성과 신뢰성을 확보하는 방향으로 빠르게 이동하고 있는 것으로 전망한다. 생성형 AI 기술이 기업 핵심 업무에 적용될수록 모델의 정확도뿐 아니라 보안과 컴플라이언스, 운영 안정성 확보 여부가 AI 도입을 결정하는 핵심 요소로 자리 잡고 있기 때문이다. 이에 AI 가드레일과 레드티밍, 모델 평가 체계 등 AI 세이프티 기술도 AI 인프라의 필수 요소로 부상하고 있는 것으로 평가된다. KT 클라우드와 카카오는 이번 협력을 계기로 공공기관과 금융권을 비롯한 다양한 산업 분야에서 신뢰할 수 있는 생성형 AI 서비스 구축을 지원하는 한편, 국내 AI 생태계 전반의 안전성 확보에도 기여한다는 방침이다. 김봉균 KT 클라우드 대표는 "생성형 AI가 본격적으로 확산되면서 성능뿐 아니라 책임 있는 AI 활용 기반을 마련하는 것이 중요한 과제가 되고 있다"며 "카카오와의 협력을 통해 AI 인프라와 안전성 기술을 결합하고, 공공과 민간 고객이 보다 신뢰할 수 있는 환경에서 AI 서비스를 개발·운영할 수 있도록 지원하겠다"고 말했다. 김세웅 카카오 AI 시너지 성과리더는 "카카오의 AI 세이프티 기술과 KT 클라우드의 인프라 역량이 만나는 이번 협력이 국내 AI 생태계의 안전성을 한 단계 높이는 계기가 되길 바란다"며 "앞으로도 이용자가 안심하고 사용할 수 있는 AI 환경을 만들기 위해 지속적으로 노력하겠다"고 말했다.
2026-06-26 10:15:27
-
SK쉴더스 EQST, AI 레드팀 대회 1위…판단 오류 취약점 공략
[경제일보] SK쉴더스 화이트해커 그룹 EQST가 글로벌 AI 레드팀 해킹대회에서 우승하며 인공지능 보안 역량을 입증했다. 생성형 AI가 산업 현장과 공공서비스 전반으로 확산되는 가운데 AI의 판단 오류를 유도하는 새로운 위협에 대응할 전문성이 중요해지고 있다는 평가다. SK쉴더스는 글로벌 AI 레드팀 해킹대회 ‘Judgement Day’에서 EQST 소속 김병현 선임이 최종 1위를 차지했다고 15일 밝혔다. 같은 팀의 마준영 선임과 김신우 선임도 각각 5위와 7위에 올라 상위권에 이름을 올렸다. 이번 대회는 AI 에이전트가 금지된 행동을 수행하거나 필수 안전 조치를 누락하도록 유도하는 공격 기법을 평가하는 방식으로 진행됐다. 단순히 시스템을 침투하는 기존 해킹과 달리 AI의 의사결정 과정을 교란하는 데 초점을 맞췄다. 시나리오는 실제 산업 환경을 반영했다. 응급환자 분류 오류, 댐 수위 판단 왜곡, 항공기 이상 징후 미탐지 등 8개 과제가 제시됐다. AI 판단이 잘못될 경우 응급실에서 중증 환자의 우선순위가 뒤바뀌거나 항공기 이상 신호가 정상으로 인식되는 등 금전적 손실을 넘어 인명 피해로 이어질 수 있음을 보여준 것이다. 김병현 선임은 이미지, 음성, 영상 등 여러 형태의 입력을 활용하는 멀티모달 프롬프트 인젝션 공격으로 높은 점수를 얻었다. 이미지 안에 잘못된 행동을 유도하는 문구를 숨기거나 실제 시스템 로그처럼 보이는 입력을 설계해 AI가 기존 규칙을 따르지 않도록 유도했다. 동일한 문제를 다양한 방식으로 빠르게 공략한 점도 높은 평가를 받았다. EQST는 국내외 주요 해킹대회에서 꾸준히 성과를 내 온 SK쉴더스의 화이트해커 조직이다. 폰투온 오토모티브, 블랙햇, 데프콘, 드림핵 등 글로벌 보안 무대에서 실전 역량을 축적해왔다. 최근에는 AI 시스템을 겨냥한 레드팀 서비스와 위협 분석 역량을 강화하고 있다. SK쉴더스는 EQST가 다양한 산업에서 축적한 침해 대응 경험과 위협 인텔리전스를 바탕으로 고객사의 AI 시스템 취약점 사전 식별을 지원하고 있다고 설명했다. 글로벌 기준인 ‘OWASP Top 10 for LLM’을 반영한 자체 프레임워크를 통해 AI 보안 점검과 대응 전략도 제공하고 있다. 김병현 SK쉴더스 EQST Lab팀 선임은 “AI 판단을 교란하는 공격 가능성을 실제로 검증하고 그 결과가 AI 안전성 연구로 이어진다는 점에서 큰 보람을 느낀다”며 “앞으로도 새로운 AI 위협에 대응하는 연구를 지속하겠다”고 말했다. 김병무 SK쉴더스 사이버보안부문장 부사장은 “생성형 AI가 산업 전반으로 확산되면서 AI 보안은 선택이 아닌 필수 역량이 되고 있다”며 “이번 대회에서 검증한 AI 레드팀 역량을 바탕으로 고객이 AI를 안전하고 신뢰성 있게 활용할 수 있도록 지원하겠다”고 밝혔다. 이번 성과는 AI 보안의 무게중심이 침입 차단에서 판단 검증으로 옮겨가고 있음을 보여준다. AI가 의료, 항공, 재난 대응처럼 사람의 생명과 직결된 의사결정에 활용될수록 공격자는 시스템의 벽보다 판단의 틈을 노릴 가능성이 크다. SK쉴더스 EQST의 우승은 국내 보안업계가 이 새로운 전장에서도 경쟁력을 갖추고 있음을 보여준 사례다.
2026-06-15 09:55:44
-