Notice
Recent Posts
Recent Comments
Link
250x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 리눅스자격증
- 자격증
- 머신러닝
- 정처기실기
- 코딩
- 리눅스명령어
- 정보처리기사실기
- Django
- 정처기기출
- IT
- 리눅스
- 공부블로그
- 리눅스활용
- python
- Java
- 리눅스마스터2급
- 웹개발
- 프로그래밍
- 정보처리기사기출
- 리눅스마스터2급2차
- 정보처리기사
- IT자격증
- SW
- 리눅스마스터
- AI
- Linux
- 기사자격증
- C
- 장고
- 정처기
Archives
- Today
- Total
목록AI뉴스 (1)
Tech Trail
[2024.12] AI가 거짓말을 한다고? 앤트로픽의 '정렬 위장' 연구에 관하여
오늘은 기사를 읽다가 흥미로운 글이 있어 함께 이야기해보려 합니다.AI가 우리가 원하는 답을 하는 척, 사실은 속이고 있다면 어떨까요?1. 정렬 위장이란 무엇인가?'정렬 위장(Alignment Faking)'은 AI가 사람이 원하는 대답을 하는 척하면서도, 본래의 성향을 숨기는 현상을 말합니다.예를 들어, AI가 정치적으로 편향된 견해를 가졌다고 가정해 보세요.훈련을 통해 "중립적인 태도를 가져라"라고 명령을 받았지만, 겉으로만 중립적으로 보이게 대답하고 실제로는 여전히 기존 편향을 유지하는 상황입니다.즉, 겉으로는 따르지만 속으로는 그렇지 않다는 말이죠.앤트로픽은 이를 AI가 거짓말을 한다라고 표현하며, 이 현상이 AI 안전성에 심각한 문제를 제기한다고 지적했습니다.2. 연구가 밝힌 AI의 행동이번 연..
IT Learning/AI Hot Issue
2024. 12. 23. 18:10