"코드 안 읽고 배포한다"…AI 코딩 시대, 개발자 책임 어디까지

이번 논의는 AI가 코드를 더 빨리 만드는 문제를 넘어, 누가 품질과 책임을 맡을 것인지로 초점이 옮겨가고 있음을 보여준다. [사진: 셔터스톡]

[디지털투데이 홍진주 기자] 인공지능(AI) 코딩 도구의 성능이 빠르게 향상되면서 개발자가 코드를 직접 검토하지 않은 채 운영 환경에 반영하는 사례가 늘고 있다. 이에 따라 생성형 AI가 작성한 코드의 책임 범위를 어디까지 설정해야 하는지를 둘러싼 논쟁도 커지고 있다.

11일(현지시간) 온라인 매체 기가진에 따르면, 개발자 사이먼 윌리슨은 최근 자신의 작업 방식에서 '바이브 코딩'(vibe coding)과 에이전트형 엔지니어링의 경계가 점점 흐려지고 있다고 밝혔다.

바이브 코딩은 AI가 생성한 코드를 세부적으로 검토하지 않고, 결과물이 일단 작동하면 그대로 수용하는 방식을 뜻한다. 반면 에이전트형 엔지니어링은 숙련된 개발자가 AI 도구를 활용하되 보안, 유지보수, 운영 안정성 등을 함께 고려하는 접근법에 가깝다.

윌리슨은 과거에는 두 개념을 명확히 구분해 왔다고 설명했다. 그는 바이브 코딩이 개인용 소규모 도구에서는 실용적일 수 있지만, 타인의 데이터나 실제 업무와 연결되는 소프트웨어에 그대로 적용하는 것은 무책임하다고 봤다.

그러나 AI 코딩 도구의 성능이 높아지면서 실제 개발 습관도 바뀌고 있다고 털어놨다. 그는 AI 코딩 에이전트인 클로드가 SQL 쿼리 실행, JSON API 생성, 테스트와 문서 작성까지 처리하는 모습을 반복적으로 경험하면서, 단순 작업에 대해서는 더 이상 코드를 한 줄씩 읽지 않게 됐다고 밝혔다.

문제는 신뢰가 커질수록 검토 절차가 느슨해질 수 있다는 점이다. 윌리슨은 "리뷰하지 않은 코드를 운영 환경에서 사용하는 것이 과연 책임 있는 행동인지 스스로 고민하게 된다"고 말했다.

그는 이런 상황을 대규모 조직 내부 서비스 사용 방식에 비유했다. 예를 들어 다른 팀이 만든 이미지 처리 서비스를 사용할 때 대부분의 개발자는 내부 구현 전체를 읽기보다 문서를 보고 먼저 활용한 뒤, 문제가 생겼을 때 세부 구조를 확인한다는 설명이다.

다만 AI에는 인간 개발팀과 달리 설명 책임(accountability)이나 평판이 존재하지 않는다는 점이 차이라고 짚었다. 특정 개발팀은 문제가 발생했을 때 책임 소재를 추적할 수 있지만, AI가 생성한 코드에는 그런 구조가 없다는 의미다.

윌리슨은 특히 반복된 성공 경험이 과신으로 이어질 가능성을 경고했다. 그는 AI가 여러 차례 정확한 결과를 내놓으면 개발자가 점차 검증 절차를 생략하게 되고, 결국 중요한 순간에 오류를 놓치는 '편차의 정규화'(normalization of deviance) 현상이 나타날 수 있다고 설명했다.

AI 시대에는 코드 품질 평가 기준도 달라지고 있다는 분석이다. 과거에는 커밋 수, 테스트 규모, README 정리 수준 등을 통해 개발 품질을 어느 정도 판단할 수 있었지만, 이제는 AI를 활용해 외형상 완성도 높은 저장소를 단시간 안에 만들 수 있게 됐기 때문이다.

이에 따라 윌리슨은 실제 사용 이력과 운영 경험이 더 중요해지고 있다고 봤다. 그는 "AI로 만든 코드라도 누군가 매일 실제로 사용하며 검증한 결과물이라면, 단순히 생성만 된 코드보다 더 가치가 있다"고 말했다.

개발자 커뮤니티 반응도 엇갈리고 있다. 일부는 AI가 개발자를 지나치게 수동적으로 만들 수 있다고 우려했다. 반면 다른 쪽에서는 고급 프로그래밍 언어 등장 이후 개발자가 더 이상 어셈블리를 직접 작성하지 않게 된 것처럼, AI 역시 개발 방식 변화의 연장선이라는 시각을 내놓고 있다.

비판도 적지 않다. 근본 원인을 분석하지 않은 채 AI가 제안한 대규모 수정 내용을 그대로 덮어쓰면 오히려 새로운 버그를 만들 수 있다는 지적이다. 이에 따라 업계에서는 AI 코딩 경쟁의 핵심이 단순 생성 능력을 넘어, 얼마나 안정적으로 검증하고 책임 있는 개발 절차 안에 통합할 수 있는지로 이동하고 있다는 평가가 나온다.

"코드 안 읽고 배포한다"…AI 코딩 시대, 개발자 책임 어디까지

가격대별 인기 장기 렌트카

장기렌트 인기TOP