사이버 보안 위험에 대응하는 데 필요한 ‘성숙한’ 준비성을 갖춘 기업 비율
Z세대 : 결제의 미래 (Gen Z: the future of spending)
디지털 신뢰 하위 그룹 중 SW 공급망 침해를 경험한 비율
2023년 구글이 삭제한 정책 위반 광고
오픈 데이터가 매년 세계 경제에 기여하는 가치
클라우드에서 소프트웨어를 개발하면 유연성과 안정성 향상, 효율성 증대, 비용 절감 등의 이점을 적극 활용할 수 있다. 그러나 문제도 많다. 애플리케이션과 개발에 드는 노력을 보호하려면 어떤 점을 주의해야 할지를 파악하는 것이 첫 번째 단계다. 클라우드 개발 전에 고려해야 할 10가지 함정을 차례대로 살펴보자. 성능 및 지연 시간 클라우드 서비스는 가용성과 성능 면에서 보통은 안정적이지만, 서비스 중단이나 성능 문제가 발생하면 개발 작업이 악영향을 받기 마련이다. 엔드포인트 보안 기업 태니엄 CIO인 에릭 가스톤은 “안타깝게도 클라우드 애플리케이션은 네트워크 혼잡, 멀티 테넌트 환경의 공유 자원, 사용자와 클라우드 데이터센터 간 지리적 거리 등으로 성능 문제를 겪는 경우가 많다. 이 문제를 해결하려면 개발자는 애플리케이션 코드 최적화 여부를 확인하고, CDN으로 최종 사용자에게 더 가까운 곳에 콘텐츠를 캐시해야 한다”라고 말했다. 성능을 개선하는 다른 방법으로는 엣지 컴퓨팅처럼 지연 시간이 짧은 클라우드 컴퓨팅 서비스에 가입하는 것도 있다. 가스톤은 “어떤 방법을 택하든 클라우드에서의 애플리케이션 성능은 설계와 구축, 그 이상의 의미를 가지며 고려할 요소가 많다”라고 말했다. SaaS 번역 플랫폼 업체인 로컬라이즐리(Localizely) CTO인 알렉사 크르스틱은 지연 시간을 줄이기 위해 데이터센터나 지역에 분산된 클라우드 서비스 사용을 고려할 수도 있다고 제안했다. 사이버 보안 및 데이터 보호 위협 다른 IT 분야와 마찬가지로 보안 및 데이터 프라이버시는 클라우드 개발 이니셔티브의 주요 관심사다. 특히 공격의 종류와 발생률이 증가하면서 더욱 해결 방법이 까다롭다. 병원과 의사를 환자와 연결하는 미국 의료 플랫폼 클리닉스팟(Clinicspots)의 소프트웨어 개발자 프라샤란 싱은 “클라우드 개발에는 민감한 데이터와 애플리케이션을 무단 액세스와 사이버 위협에서 보호하는 엄격한 보안 프로토콜이 필요하다. 클라우드 서비스의 공유형 온디맨드 특성 때문에 강력한 보안 관행을 유지하는 과정이 더욱 복잡해진다”라고 설명했다. 싱은 보안 위험 완화 방법으로 데이터 암호화, 액세스 제어 메커니즘 구현, 정기적 보안 프로토콜 업데이트가 있다며 “클라우드 서비스 업체를 철저히 조사해 업계 규정을 준수하는지 확인하는 것도 필수 과정”이라고 말했다. 맞춤형 LED 네온 조명과 간판 제조∙소매업체인 커스텀 네온(Custom Neon) CTO 맷 에어드는 클라우드 컴퓨팅의 공유 책임 모델 때문에 “인프라는 클라우드 업체가 보호해도 일반적으로 애플리케이션 수준의 보안을 책임지는 것은 기업”이라고 정의했다. 에어드는 “커스텀 네온은 엄격한 보안 절차를 마련하고 보안 감사를 자주 수행하며 지침과 규정을 준수해 문제를 해결하고 있다”라고 설명했다. 공급업체 종속 클라우드는 보통 엄청난 유연성을 제공한다. 그렇다고 개발과 테스트 환경에서도 선택의 폭이 무한하다는 뜻은 아니다. 가스톤은 “특정 공급업체에 종속돼 이탈이나 마이그레이션 시 큰 비용을 각오해야 한다는 것이 가장 큰 우려”라고 짚었다. 가스톤은 “한 업체에 종속되면 많은 문제를 야기하지만, 클라우드에 구애받지 않는 아키텍처를 채택하고 최대한 명확한 표준을 수립하면 도움이 된다”라고 조언했다. 크르스틱은 “적절한 클라우드 추상화 계층을 구현하고 표준화된 인터페이스를 준수하면 공급업체 종속이라는 위험을 완화할 수 있을 것”이라고 덧붙였다. 비용 급증 클라우드 서비스에는 비용이 숨겨져 있다. 소프트웨어 개발과 테스트 운영도 마찬가지다. 가스톤은 “클라우드가 처음 등장하자 모두들 확장된 멀티 테넌트 환경이 비용을 절감할 것이라 생각했다. 그러나 시간이 지나자 그렇지 않은 것으로 밝혀졌고, 지금도 그렇다. 계약 내용을 제대로 모니터링하고 관리하지 않는다면 클라우드 비용이 빠르게 통제 불능에 빠질 수 있다”라고 경고했다. 가스톤은 비효율적인 리소스 배포, 잘못된 사용량 예측, 리소스 할당 관리 실패가 모두 계약 초과와 예상치 못한 비용 발생에 직접적인 영향을 미친다며 “개발자는 클라우드 개발 및 운영의 재무적 측면을 잘 이해하고 있어야 한다”라고 조언했다. 모니터링 도구로 자원 사용량을 추적하고, 자동 확장 솔루션을 구현하고, 주기적으로 구성을 검토∙최적화해 비용을 통제하는 것도 여기에 포함된다. 클라우드의 확장성도 비용 관리를 어렵게 하는 주범이다. 에어드는 예상치 못한 사용량이 늘어나면 비용도 치솟을 수 있다며 “필요한 만큼만 사용하고 비용을 지불하려면, 자원 사용을 최적화하고 예상치 못한 활동에는 알람을 설정하고, 평소에도 사용량을 주의 깊게 살펴봐야 한다”라고 말했다. 규정 준수 요구 사항 클라우드 인프라의 위치에 따라 클라우드의 데이터가 여러 지역과 국가에 혼재할 수 있다. 클라우드에서 호스팅되는 애플리케이션이 특정한 규정과 법적 요건을 준수하는지를 확인해야 하는 개발자는 규정 준수 문제를 고려해야만 한다. 크르스틱은 “규정 준수 인증이 내장된 클라우드 서비스 업체를 선택하고, 법률 및 규정 준수 전문가와 긴밀히 협력하면 관련 규정을 이해하고 따르는 데 도움이 된다”라고 제안했다. 싱은 클라우드에 저장된 데이터에는 데이터센터가 있는 국가 법률이 적용되기 때문에 데이터 주권 및 현지 규정 준수와 관련한 법적 복잡성이 발생할 가능성이 있다고 지적했다. 싱은 “데이터 관리 정책을 사용하고 공급업체가 관련 규정을 따라야 한다. 하이브리드 또는 멀티 클라우드 전략을 사용하면 데이터 저장 위치를 잘 제어할 수 있다”라고 말했다. 개발팀 역시 규제 변화에 대한 정보를 지속적으로 파악하고 필요한 제어 장치를 마련해야 한다. 호환성 및 통합 싱은 클라우드 환경을 위해 설계된 소프트웨어가 인프라와 플랫폼 서비스의 차이 때문에 다른 클라우드 서비스에서 잘 작동하지 않는 문제를 고려해야 한다고 말한다. 싱은 “이 경우 여러 플랫폼에서의 호환성을 보장하기 위해 추가 개발이 필요할 수도 있다”라고 지적했다. 해결 방법의 하나는 컨테이너를 채택하고 오케스트레이션 도구를 사용해 다양한 클라우드 서비스에서 호환성을 관리하고 배포를 용이하게 하는 것이다. 개발자는 클라우드에서 복잡한 통합 작업에 직면할 수도 있다. 싱은 “클라우드 기반 애플리케이션을 기존 온프레미스 시스템과 통합하는 것은 어려운 과제다. 레거시 인프라나 소프트웨어를 처리해야 하는 경우가 많기 때문이다. 사용되는 기술의 차이 역시 통합 프로세스를 복잡하게 만드는 원인이 될 수 있다”라고 말했다. 한 가지 해결 방법은 미들웨어나 API 관리 도구로 통합 프로세스를 간소화해 클라우드와 온프레미스 시스템 간의 원활한 커뮤니케이션을 보장하는 것이다. 에어드는 “클라우드 앱을 현재의 온프레미스 시스템과 통합하는 것은 어렵다”라며 현재 API로 구동하는 모듈식 앱 개발에 집중하고, 원활한 통합을 위해 미들웨어 기술을 사용한다고 말했다. “특히 방대한 데이터를 처리할 때는 데이터를 효과적으로 관리하고 클라우드로 마이그레이션하는 것이 어렵다. 직원이 클라우드 네이티브 데이터 관리 기술을 잘 알고 있는지 확인하고, 클라우드 공급업체가 제공하는 데이터 마이그레이션 도구와 서비스를 사용한다.” 확장성 요구 클라우드 서비스의 가장 큰 이점은 필요에 따라 용량을 늘리고 줄일 수 있다는 것이다. 그러나 개발팀은 클라우드에서 소프트웨어를 생성, 테스트, 배포할 때 확장 문제에 직면할 수 있다. 대규모 클라우드 배포용 확장 가능 시스템을 설계하는 얼스웹(Earthweb)의 사이버 보안 전문가 마리아 오프레는 “경험상 가장 중요한 것은 느슨한 결합, 구성요소의 독립성, 모듈식 접근 방식을 강조해 확장성을 고려한 아키텍처를 설계하는 것이었다”라고 말했다. 오프레는 “이러한 원칙 하에 설계된 마이크로서비스 아키텍처는 매우 효과적인 것으로 입증됐다. 각 개별 서비스는 수요에 따라 독립적으로 확장할 수 있고, 오류를 격리할 수 있다. 따라서 소프트웨어가 자동으로 확장 및 축소할 수 있다”라고 설명했다. 오프레는 컨테이너와 구성 관리를 통해 변경불가능한 인프라와 자동화를 배포하는 것도 좋은 방법이라며 “선언적이고 일회성인 인프라를 만들면 확장 과정에서 발생하는 마찰을 없앨 수 있다”라고 조언했다. 문제가 발생한 다음 사후적으로 확장하는 것이 아니라 병목 현상이 나타나기 이전에 선제적으로 확장하려면, 성능과 사용량을 효과적으로 모니터링할 수 있어야 한다는 것이 오프레의 의견이다. 오프레는 “설계 초기 단계부터 ‘스케일 업이 아닌 스케일 아웃’이라는 사고방식을 취한 결과 고객사를 위해 대규모로 확장할 수 있는 시스템이 구축됐다”라고 말했다. 분산된 협업 및 커뮤니케이션 소프트웨어 개발팀에게는 효과적인 커뮤니케이션과 협업 능력이 필수적이다. 그렇지 않으면 팀원이 개발 프로세스의 진행 상황을 파악하기가 몹시 어려워진다. 하지만 소프트웨어 업체 텍스트드립(Textdrip)의 CEO 필 포트먼은 클라우드에서 작업하는 분산된 개발팀 간의 효과적인 협업을 촉진하는 것은 어려운 일이라고 말했다. 포트먼은 팀이 “협업 도구를 채택하고 애자일 방법론을 구현하며 정기적인 스탠드업 회의와 문서화를 통해 명확한 의사소통을 장려해야 한다”라고 주장했다. 테스트 및 배포라는 과제 애플리케이션의 테스트 및 배포에도 나름의 어려움이 있을 수 있다. IT 서비스 및 컨설팅 업체 베어스데브(BairesDev)의 솔루션 아키텍트 후안 나시프는 "클라우드 기반 시스템을 테스트하는 것은 특히 복잡하고 분산되어 있다면 더욱 어렵다"라고 말했다. 나시프는 "테스트 도구와 프로세스로 클라우드 기반 시스템을 테스트할 수 있다. 또한 자동화 도구를 사용해 테스트 프로세스를 자동화할 수도 있다”라고 제안했다. 싱은 클라우드 애플리케이션을 테스트하려면 클라우드 서비스의 분산된 특성으로 인해 기존 소프트웨어와는 다른 접근 방식이 필요하다며 "여러 환경과 구성을 다룰 때는 배포도 어려워진다"라고 말했다. 이때 지속적 통합/지속적 배포(CI/CD) 파이프라인을 구현하면 테스트나 배포 프로세스를 간소화하고 여러 환경에서 일관성을 유지할 수 있다. 글로벌 시장을 위한 개발 전 세계 시장을 겨냥한 클라우드 애플리케이션을 설계하는 전문 지식이나 자원이 부족할 때가 있다. CSA 리서치 이사 레베카 레이는 클라우드 애플리케이션을 설계하는 디자이너, 제품 관리자, 기술 담당자는 제품의 전 세계적 성공에 대한 책임을 지고 있으면서도 필요한 자원이 부족하거나 해외 경험이 거의 없는 경우가 많다고 말했다. 이때의 해결책은 여러 단계에서 현지화 팀과 협력해 제품 설계가 전 세계에서 통용되도록 하는 것이다. 레이는 아이디어 도출, 제품 요구사항의 우선 순위 지정, 사용자 인터페이스 디자인을 예로 들었다. 레이는 “아무리 작은 요구사항이나 애자일 프로세스라도 모든 클라우드 릴리즈에 포함하기에는 항상 기능이 너무 많기 마련이다. 현지화 전문가는 국제적 사용례, 현지 비즈니스 관행, 국내 규제 환경 및 다양한 경쟁 환경을 기반으로 가중치를 부여하는 기준을 개발하는 전문성을 갖췄다”라고 설명했다. editor@itworld.co.kr
일반 대중과 여러 기업에서 생성형 AI를 광범위하게 사용하려는 움직임이 계속되고 있다. 하지만 오류, 저작권 침해 문제, 노골적인 환각 현상으로 인해 정확성에 대한 신뢰가 훼손되는 경우가 종종 발생한다. 스탠포드 대학교의 한 에 따르면, 생성형 AI는 법률 관련 질문에 답할 때 75% 확률로 실수를 저지르는 것으로 나타났다. 해당 연구팀은 "두 개의 서로 다른 사건 사이의 선례 관계를 측정하는 작업에서 LLM은 무작위 추측보다 더 나은 결과를 만들어내지 못했다"라고 말했다. 문제는 오픈AI의 GPT-4, 메타의 라마2(Llama2), 구글의 팜2(PaLM2)와 같이 생성형 AI 기술의 기반이 되는 LLM이 비특이적인 파라미터를 가진 무정형 형태일 뿐 아니라 LLM을 학습시키는 것이 선천적으로 편견을 가지고 태어난 인간이라는 점이다. LLM은 규모가 커질수록 추측성 또는 무작위적인 답변이 많아지는 '확률적 앵무새'라는 특징을 가지고 있다. 이런 ''은 논리 프레임워크 없이 학습한 내용을 계속 앵무새처럼 반복한다. 환각 및 기타 생성형 AI 관련 오류를 줄이는 대표적인 방법은 특정 데이터 소스를 사용해 LLM의 근거를 갖추는 데 사용되는 기법인 다. RAG를 통해 쿼리에 대해 보다 정확하고 구체적인 응답이 가능한 맞춤화된 생성형 AI 모델을 만들 수 있다. 그러나 추론에 대한 논리적 규칙이 여전히 부재하므로 RAG 역시 생성형 AI의 혼란을 정리하지 못한다. 즉, NLP(Natural Language Processing)에는 신뢰할 수 있는 결론(출력)을 도출하기 위한 투명한 추론 규칙이 없다. 일각에서는 생성형 AI가 제공하는 최종 답변에 이르는 각 단계에서 신뢰할 수 있는 결론을 보장하기 위해 '공식 언어' 또는 일련의 규칙/가드레일이 필요하다고 주장한다. 정확한 의미를 위한 공식적인 시스템이 없는 상태의 NLP는 주관적이고 토대가 미흡한 의미를 생성한다. AI 스타트업 엘리멘탈 코그니션(Elemental Cognition) CEO이자 컴퓨터 과학자 데이비드 페루치는 "쉽게 말해 2+2는 4라는 간단한 합의와 비슷하다. 4라는 최종 답변에는 모호함이 없다"라고 말했다. 엘리멘탈 고그니션은 '신경 기호 추론기(neuro-symbolic reasoner)'인 브래이드(Braid)를 개발했다. 브래이드는 엘리멘탈 코그니션 직원들과 진행한 인터뷰에 기반해 LLM의 언어 논리 모델을 구축한다. 페루치는 "예를 들면 비즈니스 분석가를 인터뷰할 때 '문제를 이해했는지 확인하겠다. 귀하에게 중요한 여러 비즈니스 규칙과 관계 제약 및 권한을 살펴보겠다'라는 표현을 사용한다. 이런 표현이 들어간 인터뷰를 학습하면 결국에는 이런 문제를 해결하는 방법을 알고 있는 정규 논리 추론자가 실행하는 정규 지식 모델을 얻게 된다"라고 설명했다. 간단히 말해 페루치는 "신경망의 장점을 살린 다음 논리, 투명성, 설명 가능성, 협업 학습을 추가한다. 이 작업을 LLM으로 엔드투엔드로 수행하려고 하면 실수하게 되고, 실수를 했다는 사실도 모르게 된다. 엘리멘탈 코그니션의 아키텍처는 LLM 단독 아키텍처가 아니다"라고 덧붙였다. 엘리멘탈 코그니션의 아키텍처에서 비즈니스에 맞는 답변을 제공하기 위해 LLM을 미세 조정하는 방식인 프롬프트 엔지니어링은 일련의 논리적 규칙으로 대체된다. 이런 규칙은 LLM을 통해 대화하는 범용 추론기가 정확하고 명확한 대화를 실행하도록 보장한다. 엘리멘탈 코그니션은 출력물에 대해 일종의 체크섬을 계산하는 생성형 AI 모니터링, 평기 및 관찰 툴을 개발한다. 이런 체크섬 기술은 다른 AI 엔진, 즉 한 AI 플랫폼이 다른 AI 플랫폼을 모니터링하는 데도 사용해 첫 번째 플랫폼이 잘못된 답변이나 콘텐츠를 내보내지 않도록 도와주는 역할을 하기도 한다. 엘리멘탈 코그니션과 함께 이런 종류의 생성형 AI 도구를 제공하는 업체는 아리제(Arize), 트루에라(TruEra), 휴먼루프(Humanloop) 등이 있다. IDC의 AI 및 자동화 부문 리서치 디렉터 캐시 랭에 따르면, 데이터로봇(DataRobot)과 같은 다양한 ML 플랫폼도 AI 모니터링 분야로 진출하고 있다. 지금까지는 엔터프라이즈 배포 환경에서 생성형 AI 결과물을 모니터링하는 작업에는 일반적으로 사람이 직접 참여해야 했다. 가까운 미래에도 그럴 가능성이 높지만, 모니터링 및 평가 기술이 뒷받침되면 생성형 AI는 훨씬 더 정확한 응답을 생성할 수 있다. 랭은 "사람이 LLM의 결과와 반응을 판단한 다음 피드백을 모델에 통합하는 방식은 확장성이 떨어진다. 최근에는 평가 함수나 다른 LLM을 사용해 다른 LLM의 결과를 판단하는 방법이 트렌드가 되고 있다"라고 말했다. 랭은 LLM 모니터링 소프트웨어를 일반적으로 LLM 기반 애플리케이션을 평가하고 디버깅하는 LLMOps(Large Language Model Operation) 범주에 포함한다. 더 일반적으로는 FMOps(Foundation Model Operation)라고 부른다. 랭에 따르면, FMOps는 생성형 AI 라이프사이클을 자동화하고 간소화하는 데 사용된다. FMOps 기능에는 기초 모델 테스트, 평가, 추적 및 비교, 새로운 데이터로 조정 및 조정, 맞춤형 파생 모델 개발, 성능 디버깅 및 최적화, 프로덕션에서 FM 기반 애플리케이션 배포 및 모니터링 등이 포함된다. 랭은 "말 그대로 LLM을 위한 머신러닝 운영이며, LLM 기반 애플리케이션 수명주기를 운영하기 위한 새로운 도구 세트, 아키텍처 원칙 및 베스트 프랙티스에 중점을 둔다"라고 덧붙였다. 예를 들어, 아리제의 피닉스(Phoenix)는 하나의 LLM을 사용해 관련성, 유해성 및 응답 품질을 평가한다. '은 원격 측정 데이터를 사용해 LLM의 실행과 주변 애플리케이션 컨텍스트를 이해한다. 즉, LLM 워크플로우가 중단된 위치를 파악하거나 검색 및 도구 실행과 관련된 문제를 해결할 수 있다. 가트너 수석 애널리스트 아비바 리탄은 LLM 모니터링 및 평가 방식은 다양하다고 설명한다. 어떤 사람은 데이터의 출처를 확인하고 LLM 응답의 출처를 확인하려고 시도하고 "출처를 찾을 수 없으면 환각으로 간주한다"라고 설명했다. 입력과 출력 임베딩 간 모순을 찾아 일치하지 않거나 '합산'되지 않으면 환각으로 표시하는 방식도 있다. 혹은 '이상치(outlier)' 혹은 통상적이지 않은 응답을 찾는 기술도 있다. 구글 검색과 동일한 방식으로 데이터베이스의 정보를 숫자 데이터로 변환하는 것을 '임베딩'이라고 한다. 예를 들어, 한 지역의 호텔을 가격, 편의시설 및 위치에 기반해 5자리 숫자로 지정할 수 있다. 해당 지역에서 가격 및 편의시설이 비슷한 호텔을 구글에서 검색하면 검색 엔진은 비슷한 숫자를 가진 모든 호텔을 제시한다. 같은 방식으로 LLM 평가 소프트웨어는 임베딩과 유사한 답변, 즉 쿼리와 가장 유사한 데이터를 찾는다. 리탄은 "임베딩과 멀리 떨어져 있는 데이터는 이상치를 의미하며, 이상치인 이유를 찾을 수 있다. 그러면 그것이 올바른 데이터 소스가 아니라는 것을 확인할 수 있다. 구글은 검색 데이터와 검색 기능을 모두 갖추고 있기 때문에 이런 방법을 선호한다"라고 설명했다. LLM 평가 도구를 통해 환각과 잘못된 출력을 최소화하는 또 다른 방법은 주어진 응답의 출처를 찾는 것이다. 신뢰할 수 있는 출처가 없다면 이는 환각이라는 뜻이다. 랭은 "모든 주요 클라우드 공급업체도 LLM 애플리케이션을 조정하고 평가하는 데 도움이 되는 유사한 유형의 기술을 연구하고 있다"라고 덧붙였다. editor@itworld.co.kr
필자는 연례 성과 평가를 그다지 좋아하지 않는다. 솔직히 거의 의미가 없다고 생각하는 편이다. 평가 과정을 반기는 사람은 아무도 없으니 말이다. 누구도 원치 않는 과정에 왜 기업이 그 많은 인력을 투입해야 할까? 유능한 관리자라면 모든 직속 부하 직원과 정기적으로 회의를 하고 각 직원의 위치와 성과를 정확히 파악하도록 도와야 한다. 지속적이고 시의적절한 피드백은 연례 평가보다 훨씬 효과적이다. 이런 피드백을 제공할 수 있다면 성과 평가 과정은 완전히 시간 낭비나 마찬가지가 될 것이다. 기업은 모든 직원의 상황과 업무 진행 정도를 투명하게 공개하는 문화를 조성해 성과 평가라는 불필요한 중복 작업을 없애야 한다. 직속 부하 직원이 자신의 현재 상태를 완전히 파악하지 못한다면 그 관리자가 자신의 일을 다하지 못한 것이다. 소프트웨어 개발자라면 성과 평가에 대한 회의는 더 늘어난다. 지표만 보면 의미 놓쳐 개별 개발자 지표에 의존하는 성과 평가는 특히 유익하지 않다. 최근 관리 트렌드는 정량화 가능한 지표가 기업 성공에 중요하다고 주장하는데, 소프트웨어 개발자 평가에도 같은 접근 방식을 적용하는 것이 문제다. 훌륭한 소프트웨어 개발의 본질인 창의성, 문제 해결, 혁신은 본질적으로 정량화와 반대된다. 지표를 강조하면 개발자가 프로젝트나 기업 목표에 의미 있는 기여를 하기보다 임의적으로 움직이는 측정 바늘을 우선시할 우려가 있다. 소프트웨어 개발은 ‘팀 종목’이라고도 불린다. 개인을 기준으로 기여도를 평가하면 불건전한 경쟁을 조장하고 팀워크를 약화하며, 기술적으로는 타당하지만 좋은 코딩, 좋은 소프트웨어를 저해하는 행동을 장려하는 결과를 낳는다. 성과 평가에 대한 압박 역시 개발자의 혁신 추구를 방해해 더 안전한 선택을 종용할 수도 있다. 개발자는 안전한 길로만 가서는 안 된다. 개발 환경은 빠르게 변화하고 있으므로 실험, 시도, 혁신적 솔루션을 찾는 것을 장려해야 한다. 특정 지표를 달성해야 한다는 걱정이 커지면 새로운 시도를 억누르게 된다. 마지막으로, 성과 평가에 대한 획일적 접근 방식은 소프트웨어 개발의 고유한 특성을 고려하지 않는다. 개발자와 마케팅 팀원을 같은 기준으로 평가하면 개발자마다 지닌 고유한 기술을 포착할 수 없다. 어떤 개발자는 버그 수정에 능숙하고, 어떤 개발자는 그린필드 코드 작성을 좋아한다. 어떤 개발자는 빠르지만 정확도가 떨어진다. 반대로 느리지만 정확도가 높은 개발자도 있다. 표준 성과 평가에서 다양한 기술을 정량화하다 보면 개발자마자 각기 다른 미세한 장점을 놓치고 말 것이다. 더 나은 성과 평가 방식 인사 전문가는 아마도 반대 의견을 펼칠 것이다. 법률 문제에 정통하지는 않지만, 인사 결정을 정당화하기 위해 성과 평가에 의존한 그간의 관행은 근거가 없다는 것이 필자의 생각이다. 저성과자를 퇴사시킬 필요가 있다면, 명확하게 문서화된 성과 개선 계획(PIP)으로 문제를 해결하고, 필요하다면 단호한 조치를 취해야 한다. 종종 기업이 어떤 형태의 검토가 필요하다고 주장하는 경우가 있다. 반드시 성과 검토 시스템을 도입해야 한다면 다음 같은 방법을 추천한다. 모든 직원을 크게 3가지로 분류한다. 대다수에게는 “잘하고 있으며 앞으로도 잘하기를 바란다”라고 말해야 한다. 해당하는 사람이 아무도 없어도 되는 두 번째 그룹은 PIP를 받고 개선을 위해 노력해야 한다. 그리고 남은 사람은 그냥 내버려두면 된다. 필자는 어차피 일어나야 할 일을 얇게 덮는 베니어판 같은 이 시스템을 선호한다. 업무 성과가 좋은 사람에게는 관리자가 자주 알려준다. 성과가 모자란다면 관리자가 그 사실을 인식하고 일깨워준다. 단 한 장의 종이 안에 한 해의 주요 성과와 내년의 명확한 목표를 모두 넣을 수 있을 것이다. 그러나 성과 검토는 꼭 필요한 경우에만 실시해야 한다. 궁극적으로 직원의 행복과 생산성을 유지하려면, 신뢰와 개방성, 정직성이 있는 문화를 조성해야 한다. 좋은 일을 할 수 있다는 신뢰, 좋은 일을 하고 있다는 평가를 받는 개발자는 좋은 일을 할 것이다. 좋은 문화가 생기면 연간 성과 평가 같은 것은 완전히 불필요해진다. 성과 평가는 훌륭한 접근 방식 마련에 아무런 도움이 되지 않을 뿐이다. editor@itworld.co.kr
매월 20달러를 지불하고 코파일럿 프로(Copilot Pro)를 구독하면 마이크로소프트 오피스에서 AI 도우미 코파일럿을 이용할 수 있다. 코파일럿은 워드 문서 편집, 엑셀 스프레드시트 작업, 파워포인트 프레젠테이션 제작, 아웃룩 이메일 정리, 원노트 노트 작성 등 다양한 작업에 도움을 준다. 열려 있는 파일이 무엇이든 사용자의 질문에 답한다. 이것이 바로 코파일럿 프로의 핵심 기능이다. 코파일럿은 기업뿐 아니라 누구나 사용할 수 있는 오피스에 내장된 AI다. 프로 버전은 일반 코파일럿보다 더 많은 기능을 제공한다. 코파일럿 프로가 제공하는 기능은 정확히 무엇이며, 얼마나 좋을까? 구독할 가치가 있을까? 여기서 그 답을 찾아본다. 코파일럿 3형제 코파일럿은 마이크로소프트의 생성형 AI 기반 챗봇의 이름이다. 챗GPT와 기반 기술이 동일하다. 2023년 초 빙챗(Bing Chat)이라는 이름으로 출시됐지만, 이후 마이크로소프트는 통일성을 위해 명칭을 코파일럿으로 바꿨다. 코파일럿은 3가지 종류로 나뉜다. 코파일럿 : 표준 마이크로소프트 코파일럿은 무료다. 윈도우 11에 기본 탑재돼 있으며, 윈도우 10에도 탑재될 예정이다. 코파일럿 프로 : 워드와 같은 마이크로소프트 오피스 앱에서 코파일럿을 사용하는 것을 포함해 무료 버전은 지원하지 않는 몇 가지 추가 기능을 제공한다. 구독료는 월 20달러이며, 기업이 아닌 소비자 또는 개인 사업자를 위한 서비스다. 마이크로소프트 365용 코파일럿 : 가격 및 사용성 월 20달러의 구독료를 지불하면 코파일럿 프로를 사용할 수 있다. 무료 평가판은 제공되지 않는다. 워드, 엑셀, 파워포인트와 같은 앱에서 코파일럿 프로 기능을 사용하려면 20달러 구독료 외에 마이크로소프트 365도 구독해야 한다(최대 6인 가족의 경우 연간 11만 9,000원, 개인은 연 8만 9,000원). 월 20달러는 챗GPT 플러스(ChatGPT Plus)의 월 구독료와 동일하다. 여러 면에서 코파일럿 프로는 챗GPT의 마이크로소프트 버전이라고 볼 수 있다. 챗GPT와 다른 점은 오피스와의 통합이다. 은 사용자당 월 30달러를 지불해야 한다. 따라서 프로는 무료 버전과 기업용 코파일럿 사이의 중간에 위치한다. 무료 버전과 마찬가지로 코파일럿 프로 역시 사용할 수 있는 국가가 제한적이다. 마이크로소프트에 따르면 오스트리아, 호주, 브라질, 캐나다, 스위스, 독일, 스페인, 프랑스, 영국, 인도, 이탈리아, 일본, 멕시코, 뉴질랜드, 미국에서 사용할 수 있으며, 앞으로 더 많은 국가에서 출시될 예정이다. 기능 코파일럿 프로가 제공하는 핵심 기능은 다음과 같다. 마이크로소프트 365 앱 코파일럿 : 워드, 엑셀, 파워포인트, 아웃룩, 원노트에서 코파일럿에 액세스할 수 있다. 단순한 채팅 사이드바가 아니라 코파일럿에 문서를 만들어 달라고 요청하거나 현재 문서를 변경하도록 요청할 수 있다. 우선 접근권 : 마이크로소프트는 피크 시간대에 GPT-4 및 GPT-4 터보(Turbo) LLM에 우선적으로 액세스할 수 있다고 설명한다. 사용자는 우선 액세스 권한을 통해 응답 지연 시간을 줄이고 작업을 더 빠르게 완료할 수 있다. AI 이미지 생성 '부스트' : 최근 마이크로소프트는 코파일럿 프로에 "특정 주제에 맞는 맞춤형 코파일럿인 나만의 코파일럿 GPT를 구축할 수 있는" 과 유사하다. 이런 기능은 모두 플랫폼 전반에 걸쳐 제공된다. 예를 들어, PC 윈도우뿐 아니라 윈도우/맥/아이패드/모바일용 앱, 코파일럿 웹사이트에서도 우선적으로 코파일럿에 액세스할 수 있다. 코파일럿 프로가 제안하는 가치는 간단하다. 코파일럿의 일반 채팅 환경에 더 빠르게 액세스하고, AI 이미지를 더 빠르게 생성하는 것이다. 해당 기능을 얼마나 많이 사용하고 평소에 답변을 얼마나 오래 기다리는지에 따라 필요성이 달라진다. 그렇다면 오피스 앱에서의 코파일럿은 얼마나 잘 작동할까? 코파일럿 프로가 일반 버전과 가장 차별화되는 부분인 오피스 앱의 코파일럿 기능을 살펴본다. 마이크로소프트 365에서의 코파일럿 프로 코파일럿은 오피스에 잘 통합돼 있다. '윈도우 코파일럿'보다 훨씬 낫다. 워드를 예를 들면, 다음과 같은 방식으로 작동한다. 새 문서를 시작하면 작성할 내용을 묻는 '코파일럿을 사용한 초안' 상자가 표시된다. 새 텍스트 줄마다 코파일럿 아이콘이 표시된다. 이를 클릭하면 코파일럿이 글쓰기를 도와준다. 리본 모음에는 '편집기' 버튼 바로 옆에 '코파일럿' 버튼이 있다. 코파일럿 버튼을 클릭하면 코파일럿 사이드바를 열 수 있다. 문서를 대신 작성해 달라고 요청하거나, 현재 문서를 요약해 달라고 요청할 수 있다. 문서의 서식이나 스타일을 빠르게 바꾸고 싶을 때도 활용할 수 있다. 텍스트를 마우스 오른쪽 버튼으로 클릭하고 컨텍스트 메뉴에서 '코파일럿 > 코파일럿으로 다시 쓰기'를 선택하면 텍스트를 다시 작성할 수 있다. 이 제공하는 기능은 몇 가지 설정 변경 외에는 많지 않다. 하지만 M365 코파일럿은 오피스 문서 작업에 효과적으로 도움을 준다. 파워포인트 프레젠테이션을 구성하고 마이크로소프트 디자이너를 통해 AI 이미지를 생성할 수도 있으며, 문서를 작성하고 서식을 지정하고 기존 문서에 접근해 원하는 대로 스타일이나 서식을 변경하는 것도 가능하다. 최근 필자는 상당히 긴 분량의 워드 문서를 검토해야 했다. 사이드바에서 코파일럿에 문서의 내용에 대해 질문했는데, Ctrl+F를 사용해 특정 단어를 검색하고 해당 부분에서 내용을 추측하는 것보다 훨씬 빨랐다. 코파일럿으로 서식을 변경하면서 검토 작업에 활기를 불어넣기도 했다. 정형화된 표현을 사용하는 문서를 작성할 코파일럿과 같은 AI 도구는 빛을 발한다. 불만 처리 현황을 알리는 이메일 답변, 문의서처럼 형식적인 상용구로 작성해야 할 때 코파일럿은 매우 유용하다. 코파일럿 프로가 파워포인트 프레젠테이션을 대신 만들어 줄 수도 있지만, 추천하지는 않는다. 코파일럿 프로는 사용자가 더 자세한 지침을 주고 왔다갔다 하며 변경 사항을 요청하고 시간이 걸리는 작은 지루한 작업을 수행할 때 훨씬 더 유용하다. 한 문장짜리 프롬프트를 주고 비즈니스에 바로 사용할 수 있는 문서나 이메일을 만들기를 기대한다면 크게 실망할 것이다. 현재 작업 중인 문서에서만 AI 기능을 제공하는 코파일럿 프로는 마이크로소프트 365용 코파일럿과 비교하면 연결성이 매우 떨어진다. 코파일럿 프로의 무료 대안 코파일럿이 제공하는 여러 기능을 무료로 이용하는 방법도 있다. 코파일럿 채팅 환경은 누구나 무료로 이용할 수 있다. 앞서 설명한 대로 윈도우의 기본 제공 코파일럿 사이드바, 모바일 앱을 통해 코파일럿에 액세스해 채팅할 수 있다. 마이크로소프트 디자이너는 마이크로소프트 계정을 보유한 모든 사용자에게 무료 AI 이미지 생성 기능을 제공한다. 마이크로소프트 엣지에서 PDF를 열어 PDF에 대해 질문할 수 있다. 엣지의 코파일럿 사이드바는 열려 있는 PDF 문서 또는 현재 열려 있는 웹페이지에 대한 질문에 답한다. 엣지의 코파일럿 사이드바에는 이메일, 문장, 아이디어 목록 및 전체 블로그 게시물 초안 작성에 도움이 되는 편리한 '작성' 창도 있다. 무료로 사용할 수 있으며, 여기서 작성한 콘텐츠를 아웃룩이나 오피스 문서에 붙여 넣어 활용하면 된다. 무료 버전의 코파일럿으로도 많은 일을 할 수 있다. 코파일럿 프로의 장점은 챗봇에 대한 우선 액세스, 빠른 이미지 생성, 사용 중인 오피스 앱과의 통합을 통해 모든 작업 속도를 높일 수 있다는 점이다. 월 20달러의 가치가 있을까? 코파일럿 프로는 월 20달러로, 챗GPT 플러스와 동일한 가격이며, 기반 기술도 같다. 두 서비스 모두 DALL-3 모델을 통해 AI 이미지를 생성할 수 있다. 마이크로소프트 오피스 통합은 많은 사람에게 킬러 기능이 될 것이며, 챗GPT 플러스에서 코파일럿 프로로 전환하는 것은 진지하게 고려해 볼 만하다. 가치가 있는지는 사용자가 직접 결정할 문제다. AI 챗봇을 얼마나 자주 사용하는지, 워드·액셀·파워포인트·아웃룩·원노트에 통합된 AI 챗봇의 이점이 필요한지 잘 생각해 보자. 결정하기 어렵다면 첫 달만 20달러를 지불하고 알아보는 것도 나쁘지 않다. 반복적인 작업을 수행하거나 오피스 문서에 데이터를 찾거나 상용구 문서를 작성하는 데 많은 시간을 소비한다면 코파일럿 프로를 통해 생산성을 높이고 시간을 절약할 수 있다. 하지만 필자라면 코파일럿 프로를 소설 집필이나 기사 작성에는 사용하지는 않을 것이다. 코파일럿 프로는 오피스와 통합되었을 때 가장 빛을 발한다. 윈도우팀이 오피스팀의 조언을 받아들인다면 향후 윈도우 코파일럿도 훨씬 더 유용해질 것으로 기대된다. editor@itworld.co.kr
2022년 11월, 챗GPT(ChatGPT)가 등장하면서 기업과 소비자가 생성형 인공 지능(AI)을 사용해 작업을 자동화하고 창의적인 아이디어를 얻을 뿐만 아니라 소프트웨어 코딩도 할 수 있다는 생각이 보편화됐다. 예를 들어 이메일 또는 채팅 스레드를 간략하게 요약하려면 오픈AI의 챗GPT, 구글의 바드(Bard)와 같은 챗봇에 요청하기만 하면 된다. 더 좋은 언변과 보기 좋은 레이아웃으로 이력서를 꾸미고 싶을 때도 AI의 도움을 받을 수 있다. 새로운 마케팅이나 광고 캠페인을 위한 아이디어를 얻고 싶을 때 역시 생성형 AI를 찾으면 된다. 챗GPT는 '챗봇 생성형 사전 학습 변환기(chatbot generative pre-trained transformer)'를 의미한다. 이 챗GPT의 기반은 컴퓨터 알고리즘인 GPT 대규모 언어 모델(LLM, large language model)인데, 이 LLM이 자연어 입력을 처리하고 앞선 내용을 기반으로 다음 단어를 예측하고 또 그 다음 단어를 예측하는 방식으로 대답을 완성해 나간다. 간단히 표현하면 LLM은 다음 단어 예측 엔진(next-word prediction engine)이라고 할 수 있다. 널리 사용되는 LLM으로는 등이 있다. 지금은 개발자가 더 낮은 비용으로 더 맞춤화된 모델을 만들 수 있는 오픈소스 LLM에 특히 관심이 쏠리고 있다. 특히 메타가 2월에 를 내놓았는데 오픈소스 LLM을 사용하려는 개발자 사이에서 폭발적인 호응을 얻었다. LLM은 방대한 양의 문서, 위키피디아 항목, 책, 인터넷 기반 리소스와 기타 자료를 사용해 학습하고, 자연어 질의에 대해 인간과 비슷한 응답을 만들어내는 AI다. 여기에 사용되는 데이터의 양은 엄청나다. 그러나 LLM의 크기는 앞으로는 더 커지는 것이 아니라 작아질 것으로 보인다. 각 업체가 특정 용도로 LLM을 맞춤화해 현재 가장 인기 있는 모델에 사용되는 방대한 규모의 데이터 집합이 필요 없는 방법을 찾고 있기 때문이다. 예를 들어 에 따르면 2월 초에 발표된 구글의 새로운 팜 2 LLM은 3조 6,000억 개의 토큰 또는 단어 문자열을 학습 데이터로 사용했다. 불과 1년 전에 나온 이전 모델보다 거의 5배 많은 데이터를 사용했다. 하지만 팜 2는 더 작은 규모의 부가 데이터 집합을 통해 코딩, 수학, 창의적 작문 같은 특정 작업에서 더 좋은 성과를 낸다. LLM은 무엇인가 LLM은 데이터 입력/출력 집합을 통해 학습되는 머신러닝 신경망이다. 많은 경우 텍스트는 레이블이 지정되지 않거나 분류되지 않고, 모델은 자가 지도 또는 준지도 학습 방법을 사용한다. LLM으로 정보가 수집되거나 콘텐츠가 입력되면 알고리즘은 다음 단어를 예측해서 출력한다. 입력은 기업의 독점 데이터일 수도 있고, 챗GPT의 경우와 같이 인터넷에서 직접 수집, 스크랩한 데이터를 쓴다. 이런 데이터로 LLM을 학습시키려면 슈퍼컴퓨터 역할을 하는 거대하고 값비싼 서버 팜이 필요하다. LLM은 매개변수에 의해 제어되며 매개변수의 수는 수백만 개에서 수십억, 수조 개에 이르기도 한다. 여기서 매개변수는 LLM이 여러 응답 중에서 출력할 응답을 결정할 때 도움이 되는 요소라고 생각하면 된다. 오픈AI의 GPT-3 LLM은 1,750억 개의 매개변수를 사용하며 최신 모델인는 1조 개를 사용하는 것으로 알려졌다. 예를 들어 LLM 프롬프트 창에 "오늘 점심에 내가 먹은 것은…"이라고 입력하면 LLM은 "시리얼" 또는 "밥", "스테이크 타르타르"라는 대답을 내놓을 수 있다. 100% 정확한 답은 없지만 모델이 이미 수집된 데이터를 기반으로 확률이 높은 단어를 제시한다. 기존 데이터를 근거로 할 때 "시리얼"이라는 답이 가장 맞을 확률이 높다면 LLM은 이 단어로 문장을 완성한다. 그러나 LLM은 확률 엔진이므로 가능한 대답을 일정 비율로 제시한다. 즉, 시리얼은 50%의 확률로 출력되고, "밥"은 20% 미만의 확률로 출력되고, 스테이크 타르타르는 0.005% 미만의 확률로 출력될 수 있다. 머신러닝, 자연어 처리, 딥러닝을 연구하는 MIT의 김윤 교수는 "핵심은 LLM이 이를 학습한다는 것이다. 사람과는 다르다. 충분히 큰 학습 집합을 통해 확률이 할당되는 방식이다"라고 말했다. 그러나 "쓰레기가 들어오면 쓰레기가 나간다"는 점을 유의해야 한다. 즉, LLM이 수집한 정보가 편향되거나 불완전하거나 기타 적절치 않은 경우 LLM이 출력하는 응답도 똑같이 신뢰할 수 없고 이상하거나 심지어 모욕적일 수 있다. 응답이 정상 범위를 완전히 벗어나는 경우를 "환각(hallucination)"이라고 한다. AI를 사용해 원격으로 소프트웨어 엔지니어를 채용해주는 튜링(Turing)의 CEO 조나단 시드하스는 "환각이 발생하는 이유는 가장 기본적인 형태의 LLM에 세계에 대한 내적 상태 표현이 없기 때문이다. 즉, 사실(fact)에 대한 개념이 없다. 지금까지 본 데이터를 기반으로 다음 단어를 예측하는 통계적 추정일 뿐이다"라고 말했다. 일부 LLM은 인터넷 기반의 데이터로도 학습하므로 초기 개발자가 의도한 이상 범위까지 확장할 수 있다. 예를 들어 마이크로소프트 빙은 GPT-3를 기반으로 하지만, 검색 엔진을 쿼리해서 처음 20개 정도의 결과를 분석하기도 한다. 즉, 빙은 LLM과 인터넷을 모두 사용해서 응답을 제공한다. 시드하스는 "가령 한 프로그래밍 언어로 학습된 모델이 이전에 접한 적이 없는 다른 프로그래밍 언어의 코드를 자동으로 생성한다. 자연어도 마찬가지다. 프랑스어 학습을 하지 않았지만 프랑스어로 된 문장을 만들 수 있다. 실제로 새로운 행동이 나타나는 것 같다. 우리는 이런 신경망이 어떤 원리로 작동하는지 잘 모른다. 흥미로운 동시에 무섭기도 하다"라고 말했다. LLM은 편향되는가 LLM과 그 매개변수의 또 다른 문제는 LLM 개발자, 그리고 인터넷에서 이뤄지는 자가 지도 데이터 수집에 의해 의도하지 않은 편향성이 유입될 수 있다는 점이다. 프린스턴 대학 정보기술 정책 센터의 박사과정에 있는 사야시 카푸에 따르면 챗GPT와 같은 시스템은 인터넷과 프로그래머에게서 수집한 데이터에 따라 성별 편향적인 답을 제공할 가능성이 높다. 그는 "챗GPT에서 암시적인 편향성 테스트, 즉 성별이 명시적으로 언급되지 않고 성별의 대명사에 대한 정보만 포함되는 테스트를 실시했다. 예를 들어 문장에서 "그녀"를 "그"로 바꿨다. 그랬더니 챗GPT의 오류율이 3배 줄어들었다. 이런 선천적 편향성 때문에 언어 모델을 현실에서 사용할 때 위험할 수 있다. 예를 들어 채용 과정에서 편향된 언어 모델이 사용되면 실제 성별 편향성으로 이어질 수 있다. 이런 편향성은 개발자가 의도적으로 편향되도록 모델을 프로그래밍해서 발생하는 것이 아니다. 하지만 궁극적으로 편향성을 수정할 책임은 AI 모델을 출시하고 이를 통해 이익을 얻는 개발자에게 있다"라고 말했다. 프롬프트 엔지니어링이란 오픈AI의 GPT-4와 같은 대부분의 LLM에는 방대한 양의 정보가 사전에 주입되지만 사용자에 의한 프롬프트 엔지니어링으로도 특정 산업, 나아가 기업의 목적에 맞게 모델을 학습시킬 수 있다. MIT의 김윤은 "프롬프트 엔지니어링은 원하는 것을 말하도록 하기 위해 알고리즘에 무엇을 집어넣을지를 결정하는 것이다. LLM은 텍스트 맥락 없이 말을 쏟아내는 시스템이다. 어떤 의미에서 LLM 자체가 이미 챗봇이다"라고 말했다. 프롬프트 엔지니어링은 원하는 결과를 얻기 위해 LLM을 위한 텍스트 프롬프트를 작성하고 최적화하는 과정이다. 이제 막 탄생한 새로운 분야이므로 기업은 AI 애플리케이션에서 최적의 응답을 얻기 위해 안내 책자와 프롬프트 가이드에 의존한다. ''와 같이 프롬프트 관련 시장도 만들어지고 있다. LLM을 만들고 호스팅하는 커뮤니티 플랫폼인 허깅 페이스의 머신러닝 엔지니어인 이노 레예스는 "프롬프트 엔지니어링은 사용자에게도 중요하지만, IT 및 비즈니스 전문가 입장에서도 필수적으로 익혀야 하는 기술이다. 프롬프트 엔지니어는 비즈니스 용도에 따라 맞춤 LLM을 만드는 역할을 담당하게 된다"라고 말했다. LLM은 어떻게 더 작아지고 빨라지고 저렴해지는가 현재 LLM 기반 챗봇의 가장 보편적인 사용 형태는 "기본", 즉 텍스트 기반의 다. LLM은 구글 바드, 마이크로소프트 빙(챗GPT 기반)과 같은 검색 엔진, 그리고 자동화된 온라인 고객 지원에 사용된다. 기업은 자체 데이터 집합을 수집해 특정 비즈니스 용도에 따라 챗봇을 더 맞춤 설정할 수 있지만, 정확성 문제가 발생할 수 있다. 허깅 페이스의 창업자이자 CSO인 토마스 울프는 2월 초 MIT 컨퍼런스 현장에서 "작은 모델을 더 많은 데이터로 더 오래 학습시키면 대규모 모델이 해왔던 일을 할 수 있음을 보여주는 사례가 늘고 있다. 기본적으로 이 부분에 대한 우리의 이해도가 성숙해지고 있다고 생각한다. 첫 번째 단계에서는 일단 가동을 위해 모든 것을 시도한다. 그 다음에는 효율성을 높이고 운영 비용을 낮추기 위해 노력하는 단계다. 그동안 모두 웹 전체를 긁어오는 데 열중했지만, 이제는 양질의 데이터를 확보하는 것이 훨씬 더 중요하다"라고 말했다. 크기와 용도에 따라 다르지만 LLM을 특정 사용 사례에 맞게 학습시키는 데는 몇 백만 달러부터 많게는 1,000만 달러까지 든다. 더 작지만 양질의 데이터 집합을 활용하면 방대한 무정형 데이터 집합에 의존하는 거대 LLM과 대등하거나 오히려 더 우수한 성능을 발휘하는 것은 물론, 또한 사용자가 원하는 콘텐츠를 생성하는 데 있어 정확도도 향상된다. 학습에 들어가는 비용도 훨씬 더 적다. 마이크로소프트 AI 플랫폼 부문 부사장인 에릭 보이드는 최근 MIT 엠테크(EmTech) 컨퍼런스에서 마이크로소프트가 4년 전 오픈AI와 함께 AI 이미지 모델을 개발하기 시작했을 때의 이야기를 공개했다. 데이터 집합의 크기가 커짐에 따라 이미지 모델의 성능 향상은 오히려 정체됐다는 것이다. 반면 언어 모델의 경우 데이터 크기에 따라 성능이 함께 개선됐다. 이에 따라 오픈AI와 챗GPT의 가장 큰 재무적 후원자인 마이크로소프트는 더 큰 LLM을 구축하기 위한 인프라에 투자했다. 하지만 상황이 바뀌었다. 보이드는 "이제는 그렇게 큰 모델을 사용할 필요 없이 비슷한 성능을 얻는 방법을 연구하고 있다. 더 많은 데이터와 컴퓨팅, 학습 시간을 통해 여전히 성능을 높일 수 있지만, 그렇게 크게 만들지 않고 더 효율적으로 관리할 수 있는 방법을 찾고 있다"라고 말했다. 보이드에 따르면, 이는 매우 중요한 문제다. 컴퓨팅 등의 요소는 상당히 고가이기 때문이다. 광범위하게 LLM을 활용하려면 학습 비용과 서비스 비용을 관리할 방법을 찾아야 한다는 것이다. 예를 들어 사용자가 GPT-3에 프롬프트를 입력하면 GPT-3는 1,750억 매개변수 모두에 액세스해서 대답을 만들어낸다. 더 작은 LLM을 만드는 방법의 하나인 이른바 은 LLM의 학습 및 계산 비용을 낮춰줄 것으로 예상된다. 보이드는 "성긴 전문가 모델은 고밀도 모델보다 정확성이 더 높은 거대 모델을 만들 수 있다"라고 말했다. 메타 플랫폼(전 페이스북) 연구원들 역시 성긴 모델이 "상대적으로 극히 일부분의 컴퓨팅만 사용해서" 챗GPT와 기타 거대 LLM과 비슷한 수준의 성능을 달성할 수 있을 것으로 본다. 메타는 , 그리고 오픈AI와 같은 기업에서 작은 모델을 내놓고 있다. 더 민첩한 이들 모델의 매개변수 수는 몇 십억 개에서 1,000억 개 수준이다. 여전히 만연한 개인정보 보호, 보안 문제 사이버 보안 기업 서프샤크(Surfshark)의 개인정보 보호 부문 고문인 가브리엘 캐비카이트는 많은 사용자가 LLM 기반 챗봇의 놀라운 기능에 감탄하지만 정부와 소비자는 그 안에 잠재된 개인정보 보호 문제를 간과하면 안 된다고 말했다. 예를 들어 올해 초 이탈리아는 서방 국가 중에서는 처음으로 개인정보에 대한 우려를 이유로 챗GPT의 추가 개발을 금지했다. 나중에 금지를 풀긴 했지만 이 결정은 자연어 처리 앱에서 사용자 대화 및 결제 정보와 관련된 데이터 유출이 발생한 이후에 내려졌다. 캐비카이트는 "이탈리아의 임시 금지 조치 이후 챗GPT의 일부분이 개선됐지만 여전히 고쳐야 할 부분이 많다. 책임감 있고 윤리적인 데이터 사용을 보장하고 신뢰를 촉진하고 AI 상호작용에서 사용자 개인정보를 보호하려면 이런 잠재적인 개인정보 보호 문제를 해결하는 것이 중요하다"라고 말했다. 캐비카이트는 챗GPT의 데이터 수집 관행을 분석해 잠재적인 문제점을 찾아냈다. 예를 들어 챗GPT는 모델 학습을 위해 방대한 양의 개인 데이터를 수집했지만 이런 행위의 정당한 법적 근거가 불분명했고, AI 모델을 학습시키는 데 사용된 데이터의 당사자 중 그런 사용에 대한 고지를 받지 못하거나 정확하게 고지하지 않은 경우가 있었다. 13세 미만 어린이의 사용을 막기 위한 효과적인 연령 확인 툴이 없다. 이런 문제 외에 전문가들은 LLM이 아직 해결하지 못한 기본적인 문제점을 지적한다. 예를 들어 AI가 수집하고 저장하는 데이터의 보안, 지식재산권 도용, 데이터 기밀성 등이다. 투링의 시드하스는 "병원이나 은행에서 LLM을 사용하려면 지식재산권, 보안, 기밀성 문제를 해결해야 한다. 일반 기업도 마찬가지다. LLM에 회사 데이터를 사용했는데, 그 결과로 데이터가 유출되어 결과적으로 경쟁업체가 득을 보는 상황을 원하는 기업은 없을 것이다. 이 중 몇 가지에 대해서는 좋은 엔지니어링 솔루션이 있고, 결국 해결되리라 생각한다"라고 말했다. 전 세계 여러 국가와 정부 기관 역시 AI 툴에 대처하기 위한 작업에 착수했다. 지금까지 가장 적극적인 국가는 중국이고, 그외 국가와 정부 기관도 활발하게 움직이고 있다. 중국은 이미 AI 거버넌스를 위한 미국 바이든 행정부는 책임감 있는 혁신을 촉진하기 위한 조치를 이미 내놓은 데 이어 안전과 개인정보 보호를 위한 AI 규칙을 추가로 발표했다. 다만 의회가 AI를 규제하기 위한 법률을 현재까지 제정하지 않고 있다. 바이든 행정부는 2022년 10월 " G7 국가는 최근 AI의 발전이 안전과 보안에 대한 관리감독을 추월했다고 지적하며 AI를 규제하기 위한 기술 표준 마련을 촉구했다. 유럽 연합은 익명의 출처에서 생성한 콘텐츠를 가져올 수 있는 챗GPT와 같은 생성형 AI 플랫폼을 만드는 기업에 책임을 묻는 법률을 제정하는 마무리 단계에 있다. editor@itworld.co.kr
인터넷 보안은 그 분야 전문가에게도 복잡한 주제이며, 일반 사용자에게는 용어조차도 어려울 수 있다. 물론 모든 전문 용어를 다 알 필요는 없다. 하지만, 기본적인 용어에 대한 어휘력을 갖추면 주요 위협으로부터 자신을 보호할 수 있는 충분한 정보를 확보하는 데 도움이 될 수 있다. class="image" ⓒ Getty Images Bank 예를 들어 피싱 이메일이 무엇인지 안다면 피싱 이메일에 대한 경각심을 갖고 이런 흔한 위험을 피할 수 있다. 여기서 소개하는 주요 보안 용어는 보안 경고를 이해하고 홈 네트워크와 컴퓨터를 보호하기 위한 적절한 조치를 취하는 데 도움이 될 것이다. 핵심 보안 용어 컴퓨터 시스템과 네트워크는 무단 액세스로부터 사용자와 사용자의 데이터를 보호하기 위해 다양한 기술을 사용한다. 우선, 데이터를 보호하는 방법을 설명하는 가장 일반적인 용어부터 알아보자. 2FA. 이중 인증(TwoFactor Authentication)의 줄임말로, 비밀번호 외에 추가적인 '요소'를 추가해 온라인 계정을 보호하는 방법이다. 문자 메시지 확인 또는 신뢰할 수 있는 앱에서 생성한 코드를 추가 인증 요소로 사용할 수 있다. 만약 이중 인증을 사용할 수 있는 계정이라면, 사용하는 것이 좋다. 인증(Authentication). 일반적으로 비밀번호, 생체 인식 또는 코드 확인을 통해 플랫폼 또는 계정에 대한 승인된 액세스를 확인한다. 생체 인식. 얼굴 형상이나 지문과 같은 사용자의 신체적인 특성을 보안 인증 수단으로 사용하는 것을 말한다. 노트북의 지문 센서와 윈도우 헬로 카메라는 암호보다 더 쉽고 안전하게 로그인할 수 있는 일반적인 생체 인식 보안 기능이다. 인증서 인증(Certificate Authentication). 신뢰할 수 있는 기관에서 디지털 서명한 기록을 사용해 웹사이트, 파일 또는 시스템의 진위 여부를 확인한다. 암호화(Encryption). 미리 정해진 방식으로 정보를 뒤죽박죽으로 만들어 민감한 정보를 모호하게 하거나 숨기는 방법. 하드 드라이브 및 기타 저장 장치를 암호화하면 장치가 악의적인 사람의 손에 넘어갈 경우 데이터를 보호할 수 있으며, 네트워크 연결을 암호화하면 데이터가 네트워크를 통해 이동할 때 제 3자가 가로채지 못하도록 보호한다. 위험 및 악용 관련 용어 해커와 범죄자들이 사용하는 일반적인 위험과 수법에 관한 용어다. 보안 소프트웨어를 구매할 때는 모든 위협 유형으로부터 보호하고 내 정보가 다크 웹에 표시될 때 알려주는 옵션을 선택하기 바란다. 백도어. 공격자가 시스템에 액세스하는 은밀한 방법을 만드는 보안 취약점, 즉 PC에 열려 있는 '뒷문'을 만들어 악용하는 수법이다. 부팅 레코드 바이러스. 흔히 MBR(Master Boot Record) 바이러스라고하며, 컴퓨터 시스템이 부팅될 때 로드되는 하드 드라이브의 일부를 표적으로 삼는 바이러스 형태이다. 운영체제의 보안 기능을 우회하는 데 악용된다. 봇넷. '로봇 네트워크'의 줄임말로, 범죄자가 대상 시스템의 보안 장치나 인프라를 압도하기 위해 대량의 감염된 컴퓨터를 사용하는 것을 말한다. 무차별 대입 공격(Brute Force Attack). 사용자 아이디와 비밀번호 조합을 알아내기 위해 대량의 문자와 숫자 조합을 사용하는 방식이다. 크라임웨어(Crimeware). 사이버 범죄자가 범죄 행위를 수행하기 위해 사용하는 멀웨어이다. 봇넷에 감염된 컴퓨터를 추가하는 트로이 목마 바이러스가 대표적이다. 다크 웹(Dark Web). 특정 소프트웨어를 사용해 트래픽을 익명화하는 인터넷용 섀도우 네트워크의 일종이다. 다크 웹은 종종 도난당한 비밀번호를 포함해 불법 또는 도난당한 데이터를 전송하는 데 사용된다. 다크 웹을 모니터링하는 보안 서비스는 이런 네트워크를 검색해 위협 정보가 발견되면 사용자에게 경고한다. 데이터 마이닝. 대규모 데이터 세트를 사용해 특정 대상에 대한 상관관계를 찾는 것을 말한다. 공격자는 여러 웹사이트나 데이터베이스에서 개인에 대한 데이터 요소를 찾아내 공격을 수행하거나 신원 도용을 저지르기에 충분한 정보를 수집할 수 있다. 서비스 거부 공격. DoS(Denial of Service)라고 부르며, 대상 시스템의 정상적인 작동을 방해하기 위해 의도적으로 과부하 트래픽을 일으키는 공격이다. 봇넷을 이용해 수행하는 경우가 많다. 사전 공격(Dictionary Attcack). 대량의 공통 용어를 사용해 사용자의 비밀번호를 알아내는 자동화된 무차별 암호 대입 공격의 한 형태이댜. 결함 주입(Fault Attack). 결함 주입 공격이라고도 한다. 해커가 정상적인 기능을 우회하기 위해 서버나 웹 브라우저에 의도적으로 잘못된 데이터 패킷을 전송하는 등 시스템의 일부에 오류를 발생시켜 시스템에 액세스하는 데 사용하는 방법이다. 하이재킹(Hijacking). 감염된 컴퓨터나 네트워크 연결을 악의적인 목적으로 사용할 수 있도록 제어권을 획득하는 것을 말한다. IP 스푸핑. 일반적으로 실제 출처를 숨기거나 다른 시스템을 사칭하기 위해 자신의 IP 주소가 아닌 다른 IP 주소에서 온 것처럼 보이도록 신호를 변경하는 방법이다. 미디어 스트리밍처럼 국가별 제한이 있는 서비스를 우회적으로 이용하는 데 사용할 수 있다. 커널 공격. 운영 체제의 핵심 코드(커널이라고 함)를 수정해 정보를 훔치거나 시스템에 대한 제어 액세스 권한을 얻기 위한 채널을 생성하는 보안 악용 방법이다. 멀웨어(Malware). 컴퓨터 시스템에서 악의적인 행위를 수행하는 소프트웨어. 바이러스나 트로이 목마 또는 사용자가 입력하는 내용을 기록하여 비밀번호 및 기타 정보를 수집하는 키로거 등을 통칭하는 용어다. 중간자 공격(ManintheMiddle Attack). 두 시스템 간의 트래픽을 가로채 공격자가 임의로 조작하는 방식의 공격이다. 가로챈 데이터를 훔치거나 다른 목적으로 손상된 정보를 삽입하는 데 사용할 수 있다. 신분 위장 공격(Masquerade Attack). 합법적인 사용자 또는 시스템의 자격 증명을 사칭하거나 이를 사용해 시스템에 액세스하는 방법이다. 비밀번호 크래킹. 사전 공격 등을 통해 작동 중인 비밀번호를 알아내 시스템에 액세스하는 행위. 비밀번호 스니핑. 암호화되지 않은 비밀번호에 대한 네트워크 트래픽을 모니터링하여 사용자 자격 증명을 발견하는 방법입니다. 파밍(Pharming). 사용자가 유효한 사이트에 있다고 믿고 로그인 자격 증명이나 기타 식별 정보를 입력할 수 있는 스푸핑된 웹사이트로 트래픽을 리디렉션해 사용자의 데이터를 탈취하는 방법이다. 피싱 공격과 함께 사용되는 경우가 많다. 피싱(Phishing). 이메일이나 문자 메시지를 통해 피해자가 사용자 아이디와 비밀번호와 같은 민감한 데이터를 공개하도록 유인하는 소셜 엔지니어링 공격의 한 형태이다. 피싱 메시지는 일반적으로 은행이나 온라인 쇼핑몰처럼 신뢰할 수 있는 브랜드에서 보낸 것처럼 보이도록 디자인된 콘텐츠와 이미지를 이용한다. 포트 스캔. 공격자가 컴퓨터 시스템의 진입 지점을 발견하기 위해 사용하는 방법이다. 해커는 네트워크 또는 컴퓨터의 포트를 스캔해 사용 가능한 포트, 네트워크 내 컴퓨터에서 실행 중인 서비스 유형, 시스템에 액세스할 수 있는 기타 세부 정보를 파악할 수 있다. 랜섬웨어. 사용자가 시스템을 이용하지 못하게 잠그거나 민감하거나 당황스러운 데이터를 훔쳐내기 위한 멀웨어의 일종으로, 사용자가 액세스 권한을 되찾거나 정보 유출을 막기 위해 돈을 지불하도록 유도하는 것을 목적으로 한다. 세션 하이재킹. 사용자의 세션에서 활성 쿠키 데이터를 복제하는 등 이미 설정된 연결을 제어해 사용자의 온라인 계정에 액세스한다. 일반적으로 웹사이트 연결은 정해진 시간이 지나면 만료되는 세션 내에서 보안이 유지된다. 공격자는 만료되지 않은 세션의 쿠키 사본을 웹사이트에 제시함으로써 사용자를 사칭해 액세스 권한을 얻을 수 있다. 스니핑. 네트워크를 통해 전송되는 트래픽에서 데이터를 탐지하고 수집하는 모든 방법. 무선 네트워크에서 비밀번호를 찾는 데 자주 사용된다. 사회 공학. 인간의 사회적 취약점을 악용해 민감한 정보를 수집하거나 시스템에 액세스하는 데 사용하는 방법을 말한다. 피싱, 전화 사기, 신뢰할 수 있는 사람 사칭 등 다양한 기업이 사용된다. 스푸핑. 제한된 콘텐츠에 액세스하기 위해 컴퓨터의 IP 주소를 수정하거나 방문자를 속이기 위해 피싱 이메일 또는 가짜 웹사이트를 신뢰할 수 있는 브랜드의 소유인 것처럼 보이게 하는 등 시스템이나 계정을 그렇지 않은 것처럼 보이도록 수정하는 모든 기만적인 방법을 말한다. 트로이 목마. 겉보기에 안전한 애플리케이션 내에 숨겨져 있는 멀웨어. 컴퓨터에 악성 코드를 심는 데 이용한다. 바이러스. 스스로 복사본을 생성해 다른 파일과 시스템에 삽입함으로써 확산되는 멀웨어이다. 워초킹/워다이얼링/워드라이빙. 해커가 주변을 운전하며 무선 네트워크를 검색하거나(Wardriving), 걸어 다니며 같은 작업을 수행하고 눈에 띄는 방식으로 표적을 표시하거나(Warchoacking), 모뎀으로 액세스할 수 있는 컴퓨터를 찾기 위해 전화 번호를 자동 다이얼링하는(Wardialing) 방식으로 잠재적인 공격 대상을 발견하고 식별하는 방식이다. 전화를 받았는데 귀에서 모뎀의 치직거리는 소리가 들린다면, 워다이얼링 시도일 수 있다. 네트워킹 보안 용어 가장 단순한 홈 네트워크에도 일반적으로 침입자를 차단하고 데이터를 보호하는 데 도움이 되는 다양한 장치와 기능이 있다. 액세스 제어. 특정 디바이스의 네트워크 참여를 허용하거나 차단하는 라우터의 기능이다. 방화벽. 컴퓨터 또는 네트워크에 대한 액세스를 제한하는 장치 또는 소프트웨어이다. 방화벽을 통해 들어오고 나가는 항목에 대한 권한을 설정할 수 있다. 라우터. 네트워크의 액세스 및 트래픽 흐름을 관리하고, 네트워크 내의 컴퓨터에 주소를 할당하며, 네트워크 내의 시스템 간 연결 흐름을 지시하는 디바이스이다. 홈 라우터는 일반적으로 인터넷 서비스 업체의 모뎀에 연결되며 홈 네트워크 내의 디바이스가 서로 및 인터넷에 연결할 수 있는 중앙 허브 역할을 한다. 대부분의 라우터에는 외부 침입으로부터 네트워크를 보호하는 방화벽 및 액세스 제어 기능이 포함되어 있다. 홈 네트워크를 완벽하게 보호하려면 라우터의 기능을 알아두는 것이 좋다. 인터넷 보안 용어 사용자를 보호하고 온라인에서 데이터가 도난당하는 것을 방지하기 위해 웹사이트와 애플리케이션은 다양한 기술과 기법을 사용한다. 쿠키. 웹사이트 등의 시스템에서 사용자를 식별하고 추적하기 위해 사용하는 데이터 파일로, 종종 해당 사용자와 관련된 구성 정보가 포함되어 있다. 쿠키에는 사용자의 계정에 액세스하는 데 사용할 수 있는 개인 식별 정보 및 세션 데이터가 포함될 수 있다. 웹사이트 로그인을 활성 상태로 두면 세션 쿠키 데이터를 사용해 계정에 다시 액세스할 수 있다. 따라서 웹사이트 이용이 끝나면 의식적으로 로그아웃하면 이렇게 악용되는 것을 방지할 수 있다. HTTPS. 'S'는 안전하지 않은 일반 HTTP와 달리 신뢰할 수 있는 발급자의 서명된 인증서로 보호되는 연결을 나타낸다. 기본적으로 온라인 보안에 관심이 있다면 개인 데이터를 전송하는 모든 웹사이트의 주소가 HTTPS로 시작해야 한다. 인터넷 프로토콜(IP). 인터넷을 통해 컴퓨터를 연결하는 표준 방법으로, 각 시스템에는 IP 주소라고 하는 고유한 숫자 또는 영숫자 주소가 있습니다. IPv4의 경우, 192.168.1.72, Ipv6의 경우 2001:0db8:85a3:0000:0000:8a2e:0370:7334와 같은 주소를 사용한다. 현재 두 버전 모두 사용되고 있다. 일부 사이버 공격은 신뢰할 수 있는 출처에서 온 것처럼 보이도록 IP 주소를 변조한다. SSL(Secure Sockets Layer). 디지털 서명 보안을 사용해 인터넷에서 신뢰할 수 있는 시스템을 식별하는 보안 표준이다. 웹사이트의 신원을 확인하기 위해 HTTPS에서 사용하는 표준이기도 하다. 비즈니스 보안 용어 직장에서 IT 부서는 회사 데이터와 시스템을 안전하게 보호하기 위해 여러 가지 보안 프랙티스를 적용한다. 최소 권한. 보안을 손상시킬 수 있는 의도치 않은 구성 변경을 방지하기 위해 컴퓨터에 대한 관리자 액세스를 보류하는 등, 특정 시스템이나 사용자에게 필수 기능을 수행하는 데 필요한 만큼의 액세스 권한만 부여하는 보안 원칙이다. 기업 IT 환경에서는 이런 이유로 일반 사용자에게는 회사에서 발급한 PC에 대한 기본 액세스 권한만 부여한다. 가정에서도 자녀의 컴퓨터 설정을 제한하는 식으로 적용할 수 있다. VPN(Virtual Private Network). VPN은 인터넷을 통해 여러 대의 컴퓨터를 안전하게 연결하는 수단으로, 내부 네트워크처럼 동작하는 것이 특징이다. 많은 기업이 직원들에게 공개 인터넷이 아닌 VPN을 통해 민감한 시스템에 액세스하도록 요구한다. 가정에서도 VPN을 사용하면 웹 서핑을 할 때 개인 정보 보호 장치를 추가하는 효과를 얻을 수 있다. 기타 중요한 컴퓨터 및 보안 용어 데몬(Daemon). 컴퓨터 시스템에서 자동화된 백그라운드 프로세스로 실행되는 프로그램. 대부분의 데몬은 양성이지만, 많은 멀웨어가 데몬을 추가해 사용자 활동을 모니터링하고 인터넷을 통해 해커의 지시를 기다린다. 암호 해독(Decryption). 일반적으로 보안 인증을 통해 암호화된 데이터 또는 텍스트를 읽을 수 있는 상태로 복원하는 작업이다. 허니팟(Honeypot). 공격자를 유인하고 함정에 빠뜨리기 위해 고의적으로 노출된 시스템으로, 겉보기에는 가치 있는 데이터로 가득 차 있다. 네트워크 관리자와 사법기관이 사이버 범죄자를 잡기 위해 허니팟을 사용하기도 한다. 현재 일부 가정용 보안 방화벽에는 허니팟 기능이 포함되어 있어 액세스 시도를 감지하고 침입자에게 경고를 보낼 수 있다. 평문(Plaintext). 암호화되지 않은 텍스트 콘텐츠. 암호화된 암호 텍스트와 반대되는 개념이다. 비밀번호와 같은 민감한 정보는 어떤 시스템에도 평문으로 저장해서는 안된다. 루트(Root). 맥OS나 리눅스 같은 유닉스 계열 운영체제의 핵심 관리자 또는 수퍼유저 계정이다. 대부분의 최신 유닉스 계열 시스템은 수퍼유저 기능에 대한 무단 액세스를 방지하기 위해 기본적으로 루트 계정을 비활성화한다. 많은 사이버 공격의 목표는 루트 액세스 권한을 얻어 시스템을 완전히 장악하는 것이다. 스팸. 원치 않는 메시지로, 주로 이메일을 통해 전달되지만 문자 메시지와 소셜 미디어에서도 점점 더 흔해지고 있다. 반드시 위험한 것은 아니지만 피싱 공격과 사기가 포함될 수 있다. 제로 데이(Zero Day). 새로운 취약점이 발견된 첫날로, 공격자가 취약점을 인지하고 사용자가 시스템에 방어 패치를 적용하기 전에 취약점을 악용할 수 있기 때문에 가장 취약한 시기로 간주된다. editor@itworld.co.kr
‘뉴 노멀’에서 ‘올드 노멀’로 되돌아가는 데는 그리 오랜 시간이 걸리지 않았다. 외출할 때마다 마스크를 챙기고, 사회적 거리두기를 하던 기억도 이제는 희미하다. 하지만 코로나 19가 쏘아 올린 거시 경제적 위기는 여전했고, 2024년에도 계속될 전망이다. 불확실한 경제 상황, 예측할 수 없는 미래는 기업의 가장 큰 불안 요소이지만, 현재 상황을 분석하고 가능성 있는 미래를 염두에 둔다면 변화에 빠르게 대처할 수 있을 것이다. 2024년 IT 업계에서 가장 주목해야 할 기술은 여전히 AI다. 인터넷에 버금가는 사회/경제적 혁신을 이끌게 될 기술로 주목받는 AI는 2024년 한층 고도화되면서 안정기에 접어들 것으로 예상된다. 이에 따라 AI에 능통한 기업과 그렇지 못한 기업의 지식 격차는 2024년 기업의 생산성과 수익을 판가름할 것으로 보인다. 여기서는 2024년 한해 계획에 참고하면 좋을 만한 AI 관련 2024년 전망을 정리한다. 2024년에도 변화의 중심은 AI 가트너는 오는 2026년까지 생성형 AI 모델이나 API를 사용하는 기업이 80%에 달할 것으로 예상했다. 2023년 초에는 5% 미만이었던 것을 고려하면 폭발적인 성장이다. 이에 따라 AI의 신뢰와 리스크, 보안 관리를 의미하는 AI TRiSM(Artificial Intelligence Trust, Risk, and Security Management)의 필요성도 분명해졌다. 사전 예방적 데이터 보호, AI 전용 보안, 데이터 및 모델 드리프트, 모델 모니터링, 입출력 리스트 제어 등과 같은 AI TRiSM 기능을 적용하는 기업은 오류 및 불법 정보를 최대 80%까지 줄임으로써 보다 정확하게 의사결정할 수 있다. AI 성능에 핵심적인 역할을 하는 AI 반도체 시장도 몸집이 커지고 있다. 딜로이트는 생성형 AI 전용 반도체칩 시장 규모가 2024년 400억 달러(약 51조 9,600억 원) 수준까지 이르렀다가 2027년에는 4,000억 달러(약 519조 원)에 달할 것으로 전망했다. 또한 딜로이트는 기업용 소프트웨어 업체 대부분이 올해를 기점으로 제품과 서비스에 생성형 AI를 추가할 것이며, 생성형 AI를 도입한 SW 업체는 100억 달러(약 13조 원)의 추가 매출을 얻을 수 있다고 분석했다. 실무자의 업무 환경은 어떻게 바뀔까? 우선 중요도가 높지 않은 업무에서는 생성형 AI 사용이 고착화될 것으로 예상된다. 퀄트릭스의 ‘2024년 직원 경험 트렌드’에 따르면, 많은 직원이 자료 작성(63%), 개인 비서 역할(59%), 내부 지원 부서에 연락(50%)과 같이 AI를 직접 제어할 수 있는 업무에서 AI를 활용하는 것을 긍정적으로 생각하고 있었다. 반면 교육, 업무 성과 평가, 채용 및 승진 면접처럼 주관적인 의견이 개입되고 중요도가 높은 업무에 대해서는 선호도가 30%대에 그쳤다. AI는 직원의 업무 방식뿐 아니라 일자리 지형도 바꾸고 있다. 생성형 AI가 창의적인 사고를 성공적으로 수행하는 모습을 입증하면서 2023년에는 더 많은 일자리가 사라질 것에 대한 우려가 있었지만, 한편에서는 프롬프트 엔지니어(Prompt Engineer)처럼 AI가 창출한 새로운 역할도 생겨났다. SAS는 “AI 기술이 고용 시장에 일시적인 혼란을 야기할 수 있지만, 앞으로 경제 성장을 견인할 직무를 창출할 것“이라며, 올해는 이런 신규 일자리가 크게 주목받을 것으로 예상했다. 접근 방식도 달라진다 AI 도입이 필수적인 흐름이라면 2024년에는 비용 효율적인 운영을 고민해야 하는 시기다. 올해부터는 AI에 대한 논의가 이론에서 실제 추론 및 운영 환경으로 전환되면서 투자에 대한 초점 역시 훈련 비용에서 추론/운영 비용으로 이동할 것으로 보인다. 델 테크놀로지스에 따르면, 훈련 비용은 모델의 크기와 데이터 집합 사용에 따라 결정되지만 추론/운영 비용은 트랜잭션 수, 사용자 규모, 데이터 유형, 지속적인 유지보수에 좌우된다. 클라우데라는 비교적 적은 비용과 훈련 데이터로도 LLM 성능을 최적화하는 대표적인 3가지 방법으로 프롬프트 엔지니어링, 검색증강생성(Retrieve Augmented Generation, RAG), 파인 튜닝(Fine Tuning)에 주목했다. 또한 앞으로는 많은 기업이 더 나은 LLM을 만들기 위해 MLOps(Machine Learning Operation)와 데이터 페더레이션 기능 개발에 주력할 것으로 예상했다. AI의 잠재력을 극대화해 경쟁 우위를 확보하기 위한 방법으로 에퀴닉스는 ▲신뢰할 수 있는 출처 ▲전략적인 데이터 수집 ▲적절한 모델 3가지 요소가 필요하다고 강조했다. 또한 지난해에는 생성형 AI가 기업의 데이터를 유출하는 사고가 있었던 만큼 2024년에는 민감 데이터를 위험 요소로부터 효율적으로 보호하는 방법으로 프라이빗 AI 논의가 활발해질 것으로 전망했다. 마케팅 캠페인도 AI로 효과적으로 디지털 마케팅 분야에서도 AI가 핵심 키워드다. 인크로스는 경기 침체로 인해 2024년에는 광고 효율을 극대화할 수 있는 서비스와 기술이 계속해서 주목받을 것이라고 분석했는데, 특히 ‘AI 마케팅’이 크게 발전할 것이라고 전망했다. 실제로 마케팅 업계에서는 현재 AI를 활용해 광고 소재를 제작하고 ML을 통해 캠페인 효율을 최적화하는 추세가 점차 확산하고 있다. 인크로스는 광고 업계 전반에 AI/ML의 영향력이 확대할 것으로 바라봤다. 몰로코의 조사도 인크로스의 전망을 뒷받침한다. 몰로코가 전 세계 모바일 앱 마케터를 대상으로 실시한 조사에 따르면, 퍼포먼스 기반 모바일 마케팅 솔루션을 선택할 때 고려하는 10가지 요소 중 ‘고급 ML 기술’이 37%로 1위를 차지했다. 광고 패러다임 자체가 변화할 것이라는 전망도 있다. 메조미디어는 일방향적인 기존의 광고 방식이 생성형 AI를 통해 이용자와 상호작용하는 방식으로 광고 패러다임이 바뀔 것이며, 이에 따라 2024년에는 많은 마케터가 프롬프트 작성, 디지털 리터러시에 대한 이해, 유해 정보 필터링과 같은 생성형 AI 역량을 개발할 것으로 예상했다. 기회 혹은 위기…AI라는 양날의 검 모든 기술에는 어두운 이면이 있는 법이다. 올해 기업의 보안에 가장 큰 영향을 미칠 요소로 AI가 꼽히는 것도 자연스럽다. 미국보안산업협회(Security Industry Association, SIA)는 2024년 기업 보안에 영향을 미칠 것으로 예상되는 가장 중요한 트렌드로 AI를 선정했다. 구체적으로는 ‘AI 보안’을 가장 중요한 트렌드로 선정했으며, AI가 탑재된 디지털카메라의 비디오 인텔리전스, 생성형 AI, AI 규제가 뒤를 이었다. 매해 연말 보안 위협 전망을 내놓는 보안 업체들도 일제히 AI의 어두운 이면을 지적했다. 이글루코퍼레이션과 SK쉴더스는 피싱 이메일 작성, 악성코드 생성 등 생성형 AI를 악용해 해커가 공격을 더 쉽고 빠르게 수행할 수 있는 환경이 마련되면서 2024년 생성형 AI를 악용한 사이버공격이 증가할 것으로 전망했다. 특히 프루프포인트는 현재 맬웨어 개발자들이 AI를 활용해 더 많은 표적에 접근할 수 있는 첨단 프로그래밍 기법을 만들고 있음을 지적하며, 그 결과 2024년에는 샌드박스나 EDR(Endpoint Detection and Response)과 같은 도구를 피할 수 있는 맬웨어가 크게 확산하며 ‘맬웨어의 각축장’이 벌어질 수 있다고 경고했다. 세상의 모든 IT 리서치 자료, '넘버스' 여기서 소개한 모든 자료는 넘버스(Numbers) 서비스에 등록돼 있다. 넘버스는 IT 전문 미디어 ITWorld가 제공하는 IT 리서치 자료 메타 검색 서비스다. IDC, 가트너, 포레스터 등 주요 시장조사 업체의 자료는 물론 국내외 정부와 IT 기업, 민간 연구소 등이 발표한 기술 관련 최신 자료를 총망라했다. 2024년 1월 현재 1,300여 건의 자료가 등록돼 있으며, 매달 50여 건이 새롭게 올라온다. 등록된 자료는 출처와 토픽, 키워드 등을 기준으로 검색할 수 있고, 관련 기사를 통해 해당 자료의 문맥을 이해할 수 있다. 자료의 원문 제목과 내용을 볼 수 있는 링크, 자료를 발행한 주체와 발행 일자도 함께 확인할 수 있다. mia.kim@foundryco.com
구글의 고(Go) 프로그래밍 언어가 처음 등장했을 때는 이 언어는 호기심 많은 컴퓨터 전문가나 다루던 언어였다. 그러나 이후 10여 년의 시간을 거치면서 세계적으로 중요한 여러 클라우드 네이티브 프로젝트를 움직이는 검증된 프로그래밍 언어로 발전했다. 도커, 쿠버네티스와 같은 중요한 프로젝트에서 개발자가 고를 선택한 이유는 무엇일까? 고의 대표적인 특징은 무엇이고, 다른 프로그래밍 언어와 어떤 면에서 다를까? 고는 어떤 종류의 프로젝트에 가장 적합할까? 여기서는 고의 기능과 최적의 사용 사례는 물론 부족한 기능과 제약을 살펴보고 앞으로의 발전 방향을 예측해 본다. 작고 간소한 고 언어 고, 또는 흔히 말하는 고랭(Golang)은 오랜 유닉스 권위자이자 구글 특별 엔지니어인 롭 파이크를 주축으로 구글 직원이 만든 언어지만 엄밀히 말하면 “구글 프로젝트”는 아니다. 그보다는 언어의 사용 방법과 방향에 대해 명확한 소신이 있는 리더십의 주도로 커뮤니티에서 개발한 오픈소스 프로젝트라고 하는 편이 더 정확하다. 고는 쉽게 배울 수 있고 다루기 편하며 다른 개발자가 읽기 쉬운 언어를 목표로 한다. 고는 특히 C++와 같은 언어와 비교해 기능이 많지는 않다. 구문 측면에서는 C와 비슷하므로 오랜 기간 C를 사용해 온 개발자라면 비교적 쉽게 배울 수 있다. 그러나 고의 여러 기능, 특히 동시성 및 함수형 프로그래밍 기능은 얼랭(Erlang)과 같은 언어와 더 비슷하다. 고는 온갖 종류의 크로스 플랫폼 엔터프라이즈 애플리케이션을 구축하고 유지하기 위한 C와 유사한 언어로, 자바와도 많은 공통점을 갖고 있다. 또한 파이썬과는 유사점보다 차이점이 훨씬 더 크긴 하지만 어디에서나 실행 가능한 코드를 빠르게 개발할 수 있다는 면에서는 마찬가지라고 할 수 있다. 고 설명 문서를 보면, 고를 “동적 형식 지정 인터프리트 언어처럼 느껴지는 빠른 정적 형식 지정 컴파일 언어”라고 설명한다. 규모가 큰 고 프로그램도 컴파일에는 몇 초밖에 걸리지 않는다. 또한 고에서는 C 스타일의 include 파일 및 라이브러리에 따르는 오버헤드를 대부분 피할 수 있다. 고 언어의 강점 고는 여러 가지 면에서 개발자의 일을 편하게 해준다. 강점 1. 편리함 고는 많은 일반적인 프로그래밍 요구를 충족할 수 있다는 점에서 파이썬과 같은 스크립팅 언어와 자주 비교된다. 이런 기능 중에는 동시성과 스레드 동작을 위한 고루틴처럼 언어 자체에 내장된 경우도 있고, 고의 http 패키지와 같이 고 표준 라이브러리 패키지로 제공되는 부가적인 기능도 있다. 고는 파이썬과 마찬가지로 가비지 수집을 포함한 자동 메모리 관리 기능을 제공한다. 고 코드는 파이썬과 같은 스크립팅 언어와 달리 실행 속도가 빠른 네이티브 바이너리로 컴파일된다. 또한 C 또는 C++와 달리 고의 컴파일 속도는 매우 빨라서 고로 작업하다 보면 컴파일 언어보다는 스크립팅 언어에 가깝게 느껴진다. 고 빌드 시스템은 다른 컴파일 언어에 비해 덜 복잡하다. 몇 단계만 거치면 별다른 수고 없이 프로젝트를 빌드하고 실행할 수 있다. 강점 2. 빠른 속도 고 바이너리의 실행 속도는 C 바이너리에 비하면 느리지만 그 차이가 크지는 않아서 대부분의 애플리케이션에서 무시해도 될 정도다. 성능은 대부분의 작업에서 C에 필적하며, 자바스크립트, 파이썬, 루비 등 개발 속도로 유명한 다른 언어와 비교하면 대체로 훨씬 더 빠르다. 강점 3. 이식성 고 툴체인으로 생성된 실행 파일은 기본적인 외부 종속성 없이 독립적으로 작동할 수 있다. 고 툴체인은 다양한 운영체제 및 하드웨어 플랫폼용으로 제공되며, 이러한 툴체인을 사용해 여러 플랫폼에 걸쳐 바이너리를 컴파일할 수 있다. 강점 4. 상호운용성 고는 모든 기능을 기반 시스템에 대한 접근성을 희생하지 않고 제공한다. 고 프로그램은 외부 C 라이브러리와 통신하거나 네이티브 시스템을 호출할 수 있다. 예를 들어 도커에서 고는 저수준 리눅스 함수, 컨트롤 그룹(cgroups) 및 네임스페이스와 상호작용해 컨테이너 동작을 구현한다. 강점 5. 광범위한 지원 고 툴체인은 리눅스, 맥OS 또는 윈도우 바이너리나 도커 컨테이너로 무료로 사용 가능하다. 고는 레드 햇 엔터프라이즈 리눅스, 페도라와 같은 많은 인기 있는 리눅스 배포판에 기본적으로 포함되므로 이러한 플랫폼에 비교적 쉽게 고 소스를 배포할 수 있다. 마이크로소프트 비주얼 스튜디오 코드부터 액티브스테이트(ActiveState)의 코모도(Komodo) IDE에 이르기까지 많은 서드파티 개발 환경도 충실하게 지원한다. 고 언어가 가장 적합한 분야 모든 작업에 적합한 언어는 없지만 다른 언어에 비해 더 많은 작업에서 효과적인 언어는 있다. 고는 다음과 같은 애플리케이션 유형 개발에서 가장 빛을 발한다. 분야 1. 클라우드 네이티브 개발 고의 동시성과 네트워킹 특성, 높은 수준의 이식성은 클라우드 네이티브 앱을 구축하는 데 적합하다. 실제로 고는 도커, 쿠버네티스, 이스티오를 포함한 클라우드 네이티브 컴퓨팅의 여러 초석을 구축하는 데 사용됐다. 분야 2. 분산 네트워크 서비스 네트워크 애플리케이션의 성패는 동시성에 달려 있는데, 고루틴과 채널 등 고의 네이티브 동시성 기능이 이 부분에서 강점이 있다. API, 웹 서버, 웹 애플리케이션을 위한 최소한의 프레임워크 등 네트워킹, 분산 기능 및 클라우드 서비스를 위한 고 프로젝트가 많은 것도 이 때문이다. 분야 3. 유틸리티 및 독립형 툴 고 프로그램은 최소한의 외부 종속성을 가진 바이너리로 컴파일된다. 따라서 시작 시간이 빠르고 즉시 패키징해 재배포할 수 있으므로 유틸리티나 다른 툴을 만드는 데 적합하다. 한 가지 예로 SSH 등에 사용되는 텔레포트(Teleport)라는 액세스 서버가 있다. 텔레포트는 소스에서 컴파일하거나 사전 빌드된 바이너리를 다운로드하는 방법으로 빠르고 쉽게 서버에 배포할 수 있다. 고 언어의 제약 제약 1. 생략된 언어 기능이 많음 지향점이 뚜렷한 고의 기능은 칭찬과 비판을 동시에 받아왔다. 고는 작고 이해하기 쉬운 언어에 중점을 두고 설계됐으므로, 일부 기능은 의도적으로 생략됐다. 그 결과 다른 언어에서는 일반적인 몇 가지 기능을 고에서는 볼 수 없다. 오랜 불만 중 하나는 한 함수가 여러 유형의 변수를 받을 수 있게 해주는 제네릭 함수의 부재였다. 고 개발 팀은 고의 나머지 부분을 보완하는 구문과 동작을 구현해야 한다는 이유로 오랜 시간 동안 제네릭 추가에 반대 입장을 고수했다. 그러나 2022년 초에 출시된 고 1.18부터는 제네릭을 위한 구문이 포함됐다. 여기서 알 수 있는 점은 고는 여러 버전 간에 폭넓은 호환성을 보존한다는 이유로 중대한 기능을 추가하는 일이 거의 없고, 추가할 때도 많은 고민을 거친다는 것이다. 제약 2. 바이너리 크기가 클 수 있음 고의 또 다른 잠재적인 단점은 생성된 바이너리의 크기다. 기본적으로 고 바이너리는 정적으로 컴파일된다. 즉, 런타임에 필요한 모든 요소가 바이너리 이미지에 포함된다. 이 방식은 빌드 및 배포 프로세스를 간단하게 해주지만 그 대가로 “Hello, world!”를 출력하는 바이너리의 크기가 64비트 윈도우 기준 약 1.5MB에 이른다. 고 팀은 각 릴리스마다 바이너리의 크기를 줄이기 위한 작업을 해오고 있다. 또한 압축이나 디버그 정보를 제거하는 방법으로 고 바이너리 크기를 줄이는 것도 가능하다. 후자의 방법은 서비스가 실패할 경우 디버그 정보를 유용하게 사용할 수 있는 클라우드 또는 네트워크 서비스보다는 독립형 분산 앱에서 더 적합하다. 제약 3. 가비지 수집에서 많은 리소스 소비 고가 자랑하는 기능인 자동 메모리 관리는 단점이 되기도 한다. 가비지 수집을 위해 얼마간의 처리 오버헤드가 필요하기 때문이다. 고는 설계상 수동 메모리 관리 기능을 제공하지 않으며, 고의 가비지 수집은 엔터프라이즈 애플리케이션에서 발생하는 메모리 부하에 잘 대응하지 못한다는 비판을 받아왔다. 그래도 새 버전이 나올 때마다 메모리 관리 기능이 개선되고 있다. 예를 들어 고 1.8에서는 가비지 수집의 지연 시간이 크게 줄어들었다. 고 개발자는 C 확장에서 수동 메모리 할당을 사용하거나 서드파티 수동 메모리 관리 라이브러리를 사용할 수 있지만, 대부분의 고 개발자는 이러한 문제에 대해 네이티브 솔루션을 선호한다. 제약 4. GUI 구축을 위한 표준 툴킷의 부재 데스크톱 애플리케이션의 GUI와 같이 고 애플리케이션을 위한 풍부한 GUI를 구축하는 소프트웨어 문화는 여전히 빈약하다. 대신 대부분의 고 애플리케이션은 명령줄 툴 또는 네트워크 서비스다. 다만 고 애플리케이션에 GUI를 제공하기 위한 다양한 프로젝트가 진행 중이다. 대표적인 것이 GTK 및 GTK3 프레임워크를 위한 바인딩이다. C 바인딩에 의존하며 순수 고로 작성되지 않았지만 플랫폼 네이티브 UI를 제공하는 프로젝트도 있다. 윈도우 사용자라면 워크(walk)를 사용해볼 수 있다. 그러나 아직은 확고한 승자나 장기적인 관점에서 안전한 방법이 없다. 크로스 플랫폼 GUI 라이브러리를 구축하고자 했던 구글 프로젝트를 포함한 몇몇 프로젝트도 성과 없이 끝났다. 또한 고는 설계상 플랫폼 독립적이므로 이와 같은 프로젝트가 표준 패키지 모음의 일부가 될 가능성은 낮다. 마지막으로, 고는 네이티브 시스템 함수와 통신할 수 있지만 커널 또는 디바이스 드라이버, 임베디드 시스템과 같은 저수준 시스템 구성요소를 개발하기 위한 용도로는 적합하지 않다. 결국 고 런타임과 고 애플리케이션을 위한 가비지 수집기는 기반 운영체제에 의존한다. 이런 작업에 적합한 최신 언어에 관심이 있다면 러스트 언어를 추천한다. 고 언어의 미래 고 개발진은 고집을 부리기보다는 고 개발자 기반을 더욱 포용하는 방향으로 언어의 방향을 바꾸고 있으며, 그에 따라 앞으로는 이 개발자층의 희망 및 요구사항을 더 반영하며 개발될 것이다. 이 같은 변화의 대표적인 예가 최선의 방법에 대한 오랜 숙고 끝에 추가된 제네릭이다. 2021년 고 개발자 설문에서 고 개발자들은 고 언어가 제공하는 기능에 전반적으로 만족한다고 답했지만 개선해야 할 부분도 많다고 지적했다. 고 사용자들이 주로 개선을 원하는 분야는 종속성 관리(고 언어의 오랜 숙제), 버그 진단, 안정성이며, 그에 비해 메모리, CPU 사용률, 바이너리 크기, 빌드 시간 등의 순위는 훨씬 낮았다. 대부분의 언어는 핵심 사용 사례에 중점을 둔다. 고는 처음 등장하고 10년 동안 네트워크 서비스 틈새를 파고들었으며 이 영역에서 계속 확장해 나갈 가능성이 높다. 설문에서 확인된 고 언어의 주 사용 사례는 API 또는 RPC 서비스 생성(49%), 데이터 처리(10%), 웹 서비스(10%), CLI 애플리케이션(8%) 순이었다. 고 언어의 매력이 높아지고 있음을 보여주는 또 다른 신호는 언어 평가 후 실제로 도입하는 개발자의 수다. 프로젝트에 고 사용을 고려 중이라고 답한 설문 응답자 중 75%는 고를 선택했다. 고를 선택하지 않은 개발자가 선택한 주요 대안은 러스트(25%), 파이썬(17%), 자바(12%)였다. 이들 각 언어는 다른 틈새 시장을 발견했거나 지금 찾고 있다. 러스트의 경우 안전하고 빠른 시스템 프로그래밍, 파이썬은 프로토타이핑과 자동화 및 글루 코드, 자바는 전통적인 엔터프라이즈 애플리케이션이다. 고의 속도와 간편한 개발이 다른 사용 사례로 얼마나 확산될지, 또는 고가 엔터프라이즈 개발 분야에 얼마나 깊이 침투하게 될지는 아직 알 수 없다. 그러나 주요 프로그래밍 언어로서 고의 미래는 이미 보장돼 있다. 특히 고의 속도와 단순함은 가장 큰 미덕이다. 장기적인 유지 관리가 가능한 확장성 있는 인프라를 더 쉽게 개발할 수 있는 기반이 되는 클라우드에서고 언어의 미래는 확실하다. editor@itworld.co.kr
GPT, 바드, 라마 2 같은 대규모 언어 모델(LLM)은 대중의 상상력을 자극하고 다양한 반응을 끌어냈다. LLM에 대한 열기의 이면을 살펴보면서 대규모 언어 모델의 기원, 이러한 모델이 어떻게 구축 및 학습되는지를 살펴본다. 또한, 어떤 범위에서 효과적인지 검토하고, 가장 많이 사용되는 LLM에 대해 알아보자. 대규모 언어 모델이란? 언어 모델의 시초는 20세기 초까지 거슬러 올라가지만 대규모 언어 모델이 본격적으로 부상한 시점은 신경망이 도입된 이후다. 특히 2017년에 등장한 트랜스포머(Transformer) 심층 신경망 아키텍처는 언어 모델에서 LLM으로의 진화에 큰 역할을 했다. 대규모 언어 모델은 설명 프롬프트를 기반으로 한 텍스트 생성, 코드 생성 및 코드 완성, 텍스트 요약, 언어 간 번역, 텍스트투스피치 및 스피치투텍스트 애플리케이션을 포함한 다양한 작업에 유용하다. 한편, 적어도 현재 개발 단계에서의 LLM에는 단점도 있다. 생성된 텍스트의 품질이 그다지 좋은 편이 아니며, 형편없는 경우도 종종 발생한다. LLM은 없는 사실을 만들어 내기도 하는데 이를 환각(hallucination)이라고 한다. 답을 구하는 사용자에게 관련 지식이 없다면 환각은 상당히 그럴듯하게 들릴 것이다. 언어 번역의 경우, 네이티브 스피커의 검수를 받지 않은 문장은 100% 정확한 경우가 거의 없지만, 검수는 일반적으로 상용구에 한해서만 이뤄진다. 생성된 코드에는 버그가 흔하고, 아예 실행되지 않는 경우도 있다. 대체로 LLM은 논란의 여지가 있는 언급을 하거나 불법적인 행동을 추천하는 일이 없도록 미세한 조정을 거치지만 악의적인 프롬프트를 사용하면 안전 장치를 무력화할 수도 있다. 대규모 언어 모델을 학습시키기 위해서는 대규모 텍스트 말뭉치(corpus)가 하나 이상 필요하다. 학습 예제에는 1B 워드 벤치마크(1B Word Benchmark), 위키피디아, 토론토 북 코퍼스(Toronto Books Corpus), 커먼 크롤(Common Crawl) 데이터 집합, 그리고 공개 오픈소스인 깃허브 리포지토리 등이 포함된다. 대규모 텍스트 데이터 집합에는 저작권 침해와 쓰레기라는 두 가지 문제점이 있다. 저작권 침해의 경우 현재 여러 관련 소송이 진행 중이다. 쓰레기는 최소한 청소는 가능하다. 쓰레기 청소가 된 데이터 집합의 예로, 커먼 크롤 데이터 집합을 기반으로 한 800GB 용량의 데이터 집합인 콜로설 클린 크롤드 코퍼스(Colossal Clean Crawled Corpus: C4)가 있다. 대규모 언어 모델은 딥러닝 신경망, 대규모 학습 말뭉치를 사용하며, 신경망을 위한 수백만 개 이상의 매개변수 또는 가중치를 필요로 한다는 면에서 전통적인 언어 모델과 다르다. 하나 이상의 대용량 학습 말뭉치와 함께 LLM에는 많은 수의 매개변수, 즉 가중치가 필요하다. 매개변수의 수는 지금까지 매년 증가했다. 엘모(ELMo, 2018)의 매개변수 수는 9,360만 개이며 버트(BERT, 2018)는 1억 1,700만 개, T5(2020)는 2억 2,000만 개다. GPT2(2019)의 경우 16억 개, GPT3(2020)는 1,750억 개, 팜(PaLM, 2022)은 5,400억 개이며 GPT4(2023)의 매개변수는 1조 7,600억 개에 이른다. 매개변수가 많을수록 모델의 정확도는 높아지지만 그만큼 더 많은 메모리가 필요하고 실행 속도가 느려진다. 2023년에는 비교적 작은 모델들이 여러 가지 크기로 출시되기 시작했다. 예를 들어 라마 2(Llama 2)는 70억 개, 130억 개, 700억 개 버전으로 제공되며 클로드 2(Claude 2)는 930억 개와 1,370억 개의 매개변수 크기로 제공된다. 텍스트를 생성하는 AI 모델의 역사 언어 모델의 시초는 1913년에 시에 수학을 적용한 안드레이 마코프다. 마코프는 푸시킨의 유게니 오네긴에서 한 문자가 나타날 확률은 이전 단어에 따라 달라지며, 일반적으로 자음과 모음이 번갈아 나타나는 경향이 있음을 밝혀냈다. 현재 마코프 체인은 각 이벤트의 확률이 이전 이벤트의 상태에 따라 달라지는 이벤트 시퀀스를 설명하는 데 사용된다. 마코프의 연구는 1948년 클로드 섀넌의 통신 이론에서 확장됐고, 이후 IBM의 프레드 젤리넥과 로버트 머서가 1985년에 교차 검증 기반의 언어 모델을 만들어 실시간 대규모 어휘 음성 인식에 적용하면서 다시 한번 확장됐다. 기본적으로 통계적 언어 모델은 단어의 시퀀스에 확률을 할당한다. 언어 모델의 실제 작동을 간단히 보려면 구글 검색 또는 휴대폰에서 자동 완성을 켠 상태로 문자 메시지 앱에 단어를 몇 개 입력해보면 된다. 2000년에 요슈아 벤지오와 공동 저자들은 통계적 언어 모델의 확률을 신경망으로 대체하여 차원의 저주를 회피하고 당시 최첨단 기술이었던 평탄화 트라이그램(smoothed trigram) 모델에 비해 단어 예측을 20%~35% 개선하는 신경 확률 언어 모델을 다룬 논문을 발표했다. 피드 포워드 자동 회귀 신경망 언어 모델 개념은 지금도 여전히 사용되지만, 현재의 모델은 매개변수 수가 수십억 개에 이르고 광범위한 말뭉치로 학습되며, 그래서 ‘대규모 언어 모델’이라는 명칭으로 불린다. 언어 모델이 성능 개선을 목표로 발전하면서 시간이 갈수록 크기도 커졌다. 그러나 이 같은 크기 증가에는 단점도 있다. 2021년에 발표된 논문 ‘확률적 앵무새의 위험에 대해: 언어 모델의 크기에는 한계가 없는가?’는 언어 모델은 클수록 좋다고 생각하는 경향에 대해 의문을 제기한다. 논문 저자는 웹의 모든 것을 수집하지 말고 환경적, 재정적 비용을 먼저 고려해서 데이터 집합을 선별 및 문서화하는 데 투자할 것을 제안한다. 언어 모델과 LLM에 대한 이해 현재의 언어 모델은 다양한 작업과 목표가 있고 형태도 다양하다. 예를 들어 언어 모델은 문서에서 다음 단어를 예측하는 작업 외에 새로운 텍스트를 생성하고 텍스트를 분류하고 질문에 답하고 감정을 분석하고 명명된 개체를 인식하고 음성을 인식하고 이미지의 텍스트를 인식하고 손글씨를 인식할 수 있다. 일반적으로 중소 규모의 보충 학습 집합을 사용하여 실시되는 특정 작업을 위한 언어 모델 맞춤 설정을 미세 조정(finetuning)이라고 한다. 언어 모델에 들어가는 중간 작업의 예를 들면 다음과 같다. 학습 말뭉치를 문장으로 세분화 단어 토큰화 어간 추출 표제어 추출(어근 단어로 변환) POS(Part Of Speech) 태깅 정지단어 식별 및 제거(경우에 따라) 명명된 객체 인식(NER) 텍스트 분류 청킹(Chunking, 문장을 유의미한 구로 분할) 상호참조 해결(텍스트의 동일한 개체를 가리키는 모든 표현 찾기) 이 중에서 일부는 텍스트 분류와 같이 자체적인 작업 또는 애플리케이션으로도 유용하다. 대규모 언어 모델은 딥러닝 신경망과 대규모 학습 말뭉치를 사용하며, 신경망을 위한 수백만 개 이상의 매개변수 또는 가중치를 필요로 한다는 면에서 기존 언어 모델과 다르다. LLM 학습은 지정된 작업에 대한 모델의 오류를 가능한 가장 낮게 하기 위한 가중치 최적화의 문제다. 예를 들어 보통 자기 지도 방식으로 말뭉치의 임의의 지점에서 다음 단어를 예측하는 작업이 있다. 가장 인기 있는 LLM 최근 대규모 언어 모델의 폭발적인 성장을 촉발한 것은 2017년 발표된 “필요한 것은 주의 집중(Attention is All You Need)”이라는 논문이다. 이 논문은 “순환과 컨볼루션을 완전히 배제하고 오로지 주의 집중 메커니즘에만 기반을 둔 새롭고 단순한 신경망 아키텍처”로 트랜스포머를 소개했다. 오늘날 가장 많이 사용되는 대규모 언어 모델 중 몇 가지를 소개하면 다음과 같다. 엘모(ELMo) 엘모는 2018년에 나온 앨런NLP(AllenNLP)의 심층 맥락화 단어 표현 LLM으로, 단어 사용의 복잡한 특징, 그리고 언어적 맥락에 따라 그 단어 사용이 어떻게 달라지는지를 모델링한다. 원본 모델은 9,360만 개의 매개변수를 사용하며 1B 워드 벤치마크로 학습됐다. 버트(BERT) 버트는 구글 AI가 자사 트랜스포머 신경망 아키텍처를 기반으로 2018년에 출시한 언어 모델이다. 버트는 모든 레이어에서 왼쪽과 오른쪽의 맥락에 대한 공동 조건화를 통해 레이블 없는 텍스트로부터 심층 양방향 표현을 사전 학습하도록 설계됐다. 초기에 사용된 두 모델의 크기는 각각 매개변수 1억 개와 3억 4,000만 개였다. 버트는 토큰의 최대 15%가 “손상되는” 마스킹된 언어 모델링(MLM)을 학습에 사용한다. 영어 위키피디아와 토론토 북 코퍼스를 사용해 학습됐다. T5 구글의 2020년 텍스트투텍스트 트랜스퍼 트랜스포머(T5) 모델은 GPT, ULMFiT, 엘모, 버트 및 후속 모델에 적용된 최고의 전이 학습 기법을 기반으로 새로운 모델을 합성한다. 오픈소스 콜로설 클린 크롤드 코퍼스(C4)를 사전 학습 데이터 집합으로 사용한다. 영어용 표준 C4는 원본 커먼 크롤 데이터 집합을 기반으로 한 800GB 데이터 집합이다. T5는 모든 NLP 작업을 통합 텍스트투텍스트 형식으로 재구성한다. 클래스 레이블 또는 입력의 범위만 출력할 수 있는 버트 스타일 모델과 달리, 이 형식에서는 입력과 출력이 항상 텍스트 문자열이다. 기본 T5 모델에는 총 2억 2,000만 개의 매개변수가 사용된다. GPT 제품군 AI 연구 및 배포 기업인 오픈AI(OpenAI)의 사명은 “인공 일반 지능(AGI)이 모든 인류에 혜택이 되도록 하는 것”이다. 물론 AGI에는 아직 도달하지 못했고, 머신러닝의 개척자인 메타FAIR의 얀 르쿤 등 일부 AI 연구자는 AGI에 대한 오픈AI의 현재 접근 방식에는 답이 없다고 생각하기도 한다. 오픈AI는 GPT 언어 모델 제품군을 갖추고 있다. GPT 제품군 전체와 2018년 이후의 발전 과정을 간략하게 살펴보자. (참고로 GPT 제품군 전체는 구글의 트랜스포머 신경망 아키텍처를 기반으로 한다. 구글이 트랜스포머를 오픈소스로 공개했으므로 이는 합법적이다.) GPT(생성형 사전 학습 트랜스포머)는 오픈AI가 2018년에 출시한 모델로, 약 1억 1,700만 개의 매개변수를 사용한다. GPT는 토론토 북 코퍼스를 사용해 사전 학습된 단방향 트랜스포머이며 인과적 언어 모델링(CLM) 목표에 따라, 즉 시퀀스의 다음 토큰을 예측하도록 학습됐다. GPT2는 2019년에 출시된 GPT 확장 모델로, 매개변수는 15억 개이며 최대 40GB의 텍스트 데이터를 포함한 800만 개의 웹페이지 데이터 집합을 사용해 학습됐다. 오픈AI는 GPT2가 “너무 뛰어나고” “가짜 뉴스”로 이어질 수 있다는 이유에서 원래는 GPT2에 대한 접근을 제한했다. 이 조치는 나중에 철회됐지만, GPT3가 출시되면서 사회적 문제가 생길 가능성이 더 커졌다. GPT3는 2020년에 나온 자동 회귀 언어 모델로, 1,750억 개의 매개변수를 사용하며 필터링된 버전의 커먼 크롤과 웹텍스트2(WebText2), 북1(Books1), 북2(Books2), 영어 위키피디아의 조합으로 학습됐다. GPT3에 사용된 신경망은 GPT2와 비슷하지만 몇 개의 추가 블록이 있다. GPT3의 가장 큰 단점은 환각, 즉 명확한 근거 없이 사실을 지어내는 경향이다. GPT3.5와 GPT4에도 정도는 덜하지만 같은 문제가 있다. 코덱스(CODEX)는 2021년 GPT3에서 파생된 모델로 코드 생성을 위해 5,400만 개의 오픈소스 깃허브 리포지토리로 미세 조정됐다. 깃허브 코파일럿(Copilot)에 사용되는 모델이다. GPT3.5는 GPT3와 코덱스의 2022년 업데이트 집합이다. gpt3.5turbo 모델은 채팅에 최적화됐지만 기존의 완성 작업에서도 잘 작동한다. GPT4는 오픈AI의 주장으로는 일부 전문 및 학술 벤치마크에서 인간 수준의 성능을 발휘하는 2023년 대규모 멀티모달 모델(이미지와 텍스트 입력을 받아서 텍스트 출력을 생성)이다. GPT4는 미국 변호사 시험, LSAT, GRE 및 여러 AP 주제 시험을 포함한 다양한 시뮬레이션 시험에서 GPT3.5를 앞섰다. 참고로 시간이 지나면서 GPT3.5와 GPT4의 성능도 바뀌었다. 2023년 7월 스탠포드 대학 논문에 따르면 2023년 3월부터 2023년 6월 사이에 소수 식별을 포함한 여러 작업에서 모델의 동작이 크게 바뀌었다. GPT4 모델의 편향성에 대한 우려 GPT4의 학습 방법을 오픈AI가 설명하지 않은 것은 심각한 우려 사항이다. 오픈AI 측이 내세우는 이유는 경쟁이다. 마이크로소프트(현재까지 오픈AI에 130억 달러의 자금을 투자함)와 구글 간의 경쟁을 감안하면 어느 정도 납득은 되는 이유다. 그러나 학습 말뭉치의 편향성에 대해 알지 못한다는 것은 모델의 편향성에 대해 알지 못한다는 것을 의미한다. 에밀리 벤더는 2023년 3월 16일 마스토돈에 게시한 GPT4에 대한 글에서 “#오픈AI가 학습 데이터, 모델 아키텍처 등에 대한 정보를 *공개*하기 전까지 GPT4는 독성 쓰레기로 간주해야 한다”라고 말했다. 챗GPT와 빙GPT는 원래 gpt3.5turbo 기반의 챗봇이었지만 2023년 3월에 GPT4를 사용하도록 업그레이드됐다. 현재 GPT4 기반의 챗봇 버전에 액세스하려면 챗GPT 플러스에 가입해야 한다. GPT3.5 기반의 표준 챗GPT는 2021년 9월까지의 데이터로만 학습됐다. 빙GPT는 “더 뉴 빙”이라고도 하며, 마이크로소프트 엣지 브라우저에서 액세스할 수 있다. 마찬가지로 2021년까지의 데이터로 학습됐다. 이에 대해 빙GPT에 직접 물어보면 지속적으로 학습하면서 웹의 새로운 정보로 지식을 업데이트하고 있다고 주장한다. 홍콩 과학기술대학교 인공 지능 연구 센터의 파스칼 펑 교수는 2023년 3월 초에 챗GPT 평가에 대해 강연했는데, 시간을 투자해서 볼 만한 가치가 충분한 강연이다. 람다(LaMDA) 구글이 2021년에 발표한 “획기적인” 대화 기술인 람다(대화 애플리케이션을 위한 언어 모델)는 트랜스포머 기반 언어 모델로, 대화를 통해 학습되며 응답의 분별력과 구체성을 대폭 개선하도록 미세 조정됐다. 람다의 강점은 사람의 대화에서 흔히 발생하는 주제 표류에 대처할 수 있다는 것이다. 팜(PaLM) 팜(패스웨이 언어 모델)은 구글 리서치가 2022년에 발표한 고밀도 디코더 전용 트랜스포머 모델로 매개변수 수는 5,400억 개이며 패스웨이(Pathways) 시스템을 사용해 학습됐다. 팜은 고품질의 웹 문서와 서적, 위키피디아, 대화, 깃허브 코드를 포함한 여러 영어 및 다국어 데이터 집합의 조합을 사용해 학습됐다. 또한 구글은 모든 공백(특히 코드에 중요)을 보존하고, 어휘 목록에서 벗어난 유니코드 문자를 바이트로 분할하고, 숫자를 각 자릿수당 하나의 개별 토큰으로 분할하는 “무손실” 어휘 목록도 만들었다. 팜코더(PaLMCoder)는 파이썬 전용 데이터 집합으로 미세 조정된 팜 540B 버전이다. 팜E(PaLME) 팜E는 구글이 로봇공학용으로 2023년에 구체화한 멀티모달 언어 모델이다. 연구진은 팜을 가져와서 로봇 에이전트의 센서 데이터로 보완하여 “구체화(팜E의 ‘E’는 구체화를 의미)”했다. 또한 팜E는 팜 외에 ViT 22B 비전 모델도 채택했으므로 일반적인 기능의 비전 및 언어 모델이기도 하다. 바드(Bard) 바드는 구글이 2023년 출시한 람다 기반의 구글 대화형 AI 서비스다. 2023년 3월 21일에 출시된 후 2023년 5월 10일에 일반에 공개됐다. 바드는 출시 이후 여러 번 업데이트됐다. 2023년 4월에는 20개의 프로그래밍 언어로 코드를 생성하는 기능이 추가됐고, 2023년 7월에는 40가지 인간 언어 입력에 대한 지원과 함께 구글 렌즈가 통합되고 40개 이상의 언어를 사용한 텍스트투스피치 기능이 추가됐다. 라마(LLaMA) 라마(대규모 언어 모델 메타 AI)는 650억 매개변수를 사용하는 “원시” 대규모 언어 모델로, 메타 AI(전 메타FAIR)가 2023년 2월에 출시했다. 라마에 대한 메타의 설명은 다음과 같다. 대규모 언어 모델 분야에서는 라마와 같은 비교적 작은 기반 모델을 학습시키는 것이 바람직하다. 훨씬 더 적은 컴퓨팅 성능과 리소스만으로 새 접근 방식을 테스트하고 다른 사람들의 작업을 검증하고 새로운 사용 사례를 탐색할 수 있기 때문이다. 기반 모델은 레이블 없는 대량의 데이터 집합으로 학습되므로 다양한 작업을 위한 미세 조정에 이상적이다. 라마는 여러 크기로 출시됐으며 어떻게 구축되었는지에 대한 자세한 내용이 담긴 모델 카드가 제공된다. 메타 AI의 얀 르쿤에 따르면 원래는 체크포인트와 토크나이저를 요청해야 했지만, 정식으로 요청을 제출해서 모델을 받은 누군가가 4채널 사이트에 다운로드 가능한 토렌트를 게시한 덕분에 지금은 쉽게 구할 수 있다. 라마 2(Llama 2) 라마 2는 차세대 메타 AI 대규모 언어 모델로, 2023년 1월부터 7월 사이에 라마 1에 비해 40% 더 많은 데이터로 학습됐으며(공개적으로 사용 가능한 소스에서 2조 개의 토큰 사용), 컨텍스트 길이는 2배 더 긴 4096이다. 라마 2는 매개변수 70억 개, 130억 개, 700억 개의 여러 크기로 제공되고 사전 학습 및 미세 조정된 변형도 있다. 메타 AI는 라마 2가 오픈소스라고 주장하지만 허용되는 사용에 대한 제약이 포함됐다는 이유로 이 주장에 동의하지 않는 사람들도 있다. 커뮤니티 라이선스 외에 상용 라이선스도 제공된다. 라마 2는 최적화된 트랜스포머 아키텍처를 사용하는 자동 회귀 언어 모델이다. 조정된 버전은 지도 미세 조정(SFT)과 인간 피드백을 통한 강화 학습(RLHF)을 사용해서 유용성과 안전성에 대한 인간의 선호도에 맞게 조정된다. 라마 2는 현재 영어 전용이다. 모델 카드에는 벤치마크 결과와 탄소 발자국 통계가 포함돼 있다. 연구 논문 ‘라마 2: 개방형 기반과 미세 조정된 채팅 모델’에서 더 자세한 내용을 볼 수 있다. 클로드 2(Claude 2) 2023년 7월에 출시된 앤트로픽(Anthropic)의 클로드 2는 단일 프롬프트에서 최대 10만 개의 토큰(약 7만 단어)을 수락하며, 수천 토큰의 스토리를 생성할 수 있다. 클로드는 구조적 데이터를 편집, 재작성, 요약, 분류, 추출할 수 있으며 내용을 기반으로 한 Q&A와 그 외의 다양한 작업이 가능하다. 대부분의 학습은 영어로 이뤄졌지만 다른 여러 일반적인 언어에서도 잘 작동하며, 일반적이지 않은 언어로도 어느 정도의 커뮤니케이션이 가능하다. 프로그래밍 언어에 대한 지식도 방대하다. 클로드는 유용하고 정직하고 무해한(Helpful, Honest, Harmless, HHH) 모델로 학습됐으며 무해함을 강화하고 프롬프트를 통해 공격적이거나 위험한 출력을 생성하기가 더 어렵게 하기 위한 광범위한 레드 팀 과정을 거쳤다. 사용자의 개인 데이터를 학습에 사용하거나 인터넷에서 답을 참조하지 않지만, 사용자가 직접 클로드에 인터넷의 텍스트를 제공해서 그 내용으로 작업을 수행하도록 요청할 수는 있다. 클로드는 미국 및 영국 사용자에게 무료 베타 버전으로 제공되며, 생성형 AI 플랫폼인 재스퍼(Jasper), 코드 AI 플랫폼인 소스그래프 코디(Sourcegraph Cody), 아마존 베드록(Amazon Bedrock)과 같은 상업적 협력업체 채택됐다. 결론 살펴본 바와 같이 대규모 언어 모델은 여러 기업에서 활발하게 개발되는 중이며 오픈AI와 구글 AI, 메타 AI, 앤트로픽에서 거의 매달 새로운 버전이 나오고 있다. 이러한 LLM 중에서 진정한 인공 일반 지능(AGI)을 달성한 모델은 없지만 새 모델이 나올 때마다 대체로 지난 모델에 비해 개선되는 중이다. 다만 대부분의 LLM에서 환각을 비롯한 비정상적인 현상이 자주 발생하며, 경우에 따라 사용자 프롬프트에 대해 부정확하고 편향되거나 불쾌한 응답을 생산하기도 한다. 결국 출력이 정확함을 검증할 수 있는 경우에 한해서만 LLM을 사용해야 한다. editor@itworld.co.kr
누구나 널리 알려진 좋은 소프트웨어를 사용하고 싶지만, 사실 전문가용 프로그램은 개인이 구매하기에 너무 비싸다. 이럴 때는 실행 파일은 물론 소스 코드까지 다운로드할 수 있는 오픈소스 소프트웨어라는 대안이 있다. 무료 소프트웨어여서 그 품질과 기능에 의심이 들겠지만 걱정할 필요가 없다. 많은 오픈소스 소프트웨어가 전문가용 제품 못지않은 품질과 기능을 제공한다. 오피스부터 미디어 편집, 파일 관리 및 백업까지 분야별 최고의 오픈소스 애플리케이션을 모았다. 생산성 : 오피스, PDF 및 컨퍼런스 툴 컴퓨터에서 매일 하는 작업을 꼽으라면 무엇보다 문서 편집이다. 리브레오피스(LibreOffice)는 텍스트, 스프레드시트, 프레젠테이션을 작성하는 종합 오피스 패키지로, 2000년에 소스코드가 공개된 오픈 오피스(Open Office)에서 파생됐다. 오픈 오피스 프로젝트는 현재 아파치 오픈 오피스라는 이름으로 지속되고 있다. 리브레오피스의 빠른 업데이트 주기는 아파치 오픈 오피스보다 유리한 점이다. 최신 7.5 버전에서는 라이터(Writer)의 텍스트 문서 편집 기능이 개선돼 머리글의 서식이 향상됐고 표 삽입이 쉬워졌다. 컬러 북마크를 사용해 섹션을 더 쉽게 탐색하고 찾을 수 있다. 스프레드시트인 칼크(Calc)에서는 확장된 수식 보조 기능과 다이어그램을 위한 새로운 함수가 눈에 띈다. 드로우(Draw)와 임프레스(Impress)는 표를 더 쉽게 디자인할 수 있게 바뀌었고, EMF 그래픽을 더 빠르게 가져올 수 있다. 어두운 색의 사용자 인터페이스가 표시되는 다크 모드도 지원된다. 한편 여러 기기 간 문서 교환에 유용한 것이 바로 PDF 포맷이다. PDF 파일로 문서를 만들면 다른 운영체제와 모바일 앱에서도 문서가 깨지지 않고 똑같이 표시된다. 마킹, 메모와 같은 부가 기능을 사용해 신속하게 메모 또는 변경 요청을 문서화할 수 있고, 그룹 작업도 가능하다. 보통 많은 사람이 PDF 파일을 다루기 위해 무료 어도비 아크로벳 리더를 사용하지만, PDF 파일을 빠르게 보는 용도로는 오픈소스 프로그램인 수마트라 PDF(Sumatra PDF)가 있다. 구글 번역 및 딥엘(DeepL)을 통한 번역으로 연결되는 링크, 주석을 사용한 마커 삽입 등의 기능을 제공한다. 협업 툴도 살펴보자. 팀의 협업 형태는 코로나 시기를 거치면서 크게 변했다. 온라인 비디오 컨퍼런스가 이제 보편적으로 사용된다. 화상회의는 회의실이 불필요하고 출장을 갈 필요도 없으며 이동 중에도 참여할 수 있는 장점이 있다. 협업 툴에는 줌 또는 마이크로소프트 팀즈가 유명하지만, 오픈소스 대안으로 오픈 토크(Open Talk)가 있다. 오픈 토크 시스템은 클라우드에서 작동하며 웹사이트를 통해 바로 사용할 수 있다. 전화 걸기, 화면 공유, 투표, 회의 녹화 등 상용 경쟁 툴과 비슷한 기능을 제공한다. 이밖에 많은 기업이 이미 작업 그룹을 디지털 방식으로 관리할 텐데, 이 분야에는 매터모스트(Mattermost)가 있다. 그룹 채팅, 프로젝트 관리, 소리를 포함한 화면 공유 옵션 등을 지원하는 데스크톱, 모바일 및 온라인 시스템이다. 매터모스트 웹사이트의 무료 계정을 통해 사용할 수 있다. 회사 IT에 통합하려면 추가 소프트웨어가 필요하며, 기술 지원 및 IT 통합은 유료로 제공된다. 인터넷 : 브라우저와 이메일 메시징, 온라인 쇼핑, 인터넷 뱅킹은 많은 사람에게 없어서는 안될 요소로 자리잡았고, 이런 사이트에 액세스하려면 웹 브라우저가 필요하다. 많은 사용자가 구글 크롬을 선호하지만 크롬에는 개인정보 보호 문제가 있다. 인터넷 검색을 넘어서는 구글의 탐욕스러운 데이터 수집은 이미 악명이 높다. 대안은 언구글드 크로미엄(Ungoogled Chromium)이다. 크롬 웹 브라우저의 오픈소스 버전으로, 구글의 모든 액세스가 차단된다. 서핑 시 기능 제약은 없으며 크롬 웹 스토어의 확장 프로그램도 작동한다. 이메일 역시 PC에서 매일 사용하는 기능이다. 이메일은 속도가 빠르며 사진이나 문서, 다양한 데이터를 주고받기에 적합하다. 썬더버드(Thunderbird)는 많은 기능을 갖춘 무료 메일 프로그램이다. 여러 사서함과 다양한 전송 프로토콜, 주소록, 캘린더 등을 지원한다. 썬더버드 20주년을 맞아 개발팀은 앱 전체에 대한 전반적인 현대화를 진행중이다. 멀티 미디어 : 사진, 영상, DTP 및 디자인 디지털 사진의 인기가 계속되는 가운데, 김프(Gimp)를 사용하면 손쉽게 사진을 편집할 수 있다. 대비와 밝기를 조절하고 이미지를 더 선명하게 할 수 있다. 레이어, 마스크를 비롯한 이미지 몽타주 툴은 오래전부터 거의 모든 이미지 툴이 지원하는 표준 기능이다. 김프 버전 2.10부터는 배경 제거 툴이 추가됐고, 영역을 자르고 선택하는 툴도 포함된다. 또다른 오픈소스 이미지 편집 툴인 디지캠 포토 매니저(Digikam Photo Manager)는 사진 모음을 전체적으로 보여준다. 키워드, 평점, 컬러 마커를 기준으로 정렬하거나 사진의 메타데이터를 분석해 위치를 보여준다. RAW 이미지를 위한 편집 기능과 툴도 있다. 로우 테라피(RAW Therapee)도 RAW 사진 현상을 위한 다양한 툴과 이미지 보기 관리를 포함한 많은 RAW 옵션을 제공한다. 데스크톱 출판(DTP)용 문서 디자인 분야에는 잉크스케이프(Inkscape)와 스크라이버스(Scribus)의 조합을 추천한다. 잉크스케이프에서는 세밀한 일러스트레이션을 디자인할 수 있다. 곡선, 개체, 텍스트를 만드는 주요 기능을 지원하고, 요소 정렬, 색 채우기, 그라디언트 또는 그래픽 결합을 포함한 다양한 툴이 있다. 이 프로그램을 이용하면 확장 가능한 로고, 인포그래픽 및 기타 디자인을 빠르게 만들 수 있다. 이렇게 만든 요소는 스크라이버스의 페이지 디자인에 사용할 수 있다. 샘플 페이지와 자체 디자인된 표준 요소를 사용해 간단한 전단지 또는 메뉴뿐만 아니라 신문, 잡지도 만들 수 있다. PDF 형식으로 출력해 전문적인 인쇄까지 가능하다. 잉크스케이프와 스크라이버스는 JPG, TIF, PNG, SVG와 같은 다양한 그래픽 형식을 지원한다. 한편 그림을 그리고 스케치하고 색을 칠하는 작업을 컴퓨터에서 하는 경우가 늘어나고 있다. 그 결과 아티스트의 일러스트레이션, 그림 또는 개념 디자인까지 디지털로 받아 별도의 스캔 작업 없이 즉각 처리할 수 있는 세상이다. 이때 특수한 그래픽 프로그램을 사용하면 머리 속 아이디어를 바로 화면으로 옮길 수 있다. 크리타(Krita)가 대표적이다. 특수한 브러시 팁, 레이어, 효과, 마스크를 통해 이 과정을 지원한다. 애니메이션 옵션을 사용해 생기를 불어넣을 수도 있다. 그래픽 태블릿과 함께 사용하면 디지털 펜의 압력과 기울기까지 반영해 브러시 스트로크 또는 디지털 연필 스트로크를 표현한다. 3D 애플리케이션인 블렌더(Blender)도 있다. 나온지 30년이 넘은 이 유서 깊은 앱은 처음에 영화사에서 내부적으로만 사용되다가 2002년 오픈소스가 된 이후부터 개발 속도가 빨라졌다. 정교한 모델링과 텍스처 모듈 외에 애니메이션, 합성, 비디오 편집을 위한 기능도 제공한다. 플러그인 인터페이스와 스크립팅을 통해 사용자가 원하는 대로 확장하고 조정할 수 있다. 블렌더는 지원하는 기능이 워낙 다양해 쓰임새도 광범위하다. 예를 들어 스파이더맨 2와 원더우먼 등 헐리우드 영화 제작에도 이 툴이 사용됐다. 나사(NASA)는 인터렉티브 웹 애플리케이션인 익스피리언스 큐리오시티(Experience Curiosity)에 블렌더를 사용했다. 영상 재생기로는 VLC 미디어 플레이어가 압도적이다. 구형 휴대폰 촬영 영상부터 새로운 고해상도 4K 클립까지 VLC로 재생할 수 없는 형식은 거의 없다. 재생 목록 사용하기, 온라인 비디오 및 팟캐스트 검색, 홈 네트워크를 사용한 스트리밍 등으로 다양한 용도에 맞게 사용할 수 있다. 잘 알려져 있지는 않지만 비디오 변환 기능도 유용하다. 샷컷(ShotCut)은 비디오 편집에 유용하다. 비디오를 보고 자르고 배열하는 용도로 사용된다. 비디오, 오디오, 전환, 효과 믹싱을 위한 유연한 타임라인도 제공한다. FFmeg 프레임워크를 설치하면 다양한 비디오 형식을 가져오고 내보낼 수 있다. 많은 사용자가 마이크로소프트의 미디어 플레이어를 사용해 음악 파일을 관리한다. 미디어 플레이어는 디지털화, 재생, 다른 기기로의 스트리밍을 지원하는 좋은 툴이지만 시스템 리소스를 과도하게 쓰는 단점이 있다. 이럴 때 사용할 수 있는 오픈소스 대안이 도파민(Dopamine)이다. 훨씬 더 가벼우면서도 많은 관리 기능, 재생 목록, 통합 이퀄라이저를 제공한다. 또한 온라인에서 노래 가사를 불러오고 Last.fm 및 디스코드를 통합할 수 있다. 포터블 버전이 특히 유용하다. 음악이 들어 있는 USB 드라이브에 설치해 두면 다양한 컴퓨터에서 사용할 수 있으며 곡 데이터베이스는 항상 최신 상태로 유지된다. 이 기능은 로컬 네트워크에서도 작동한다. 보안과 관리 : 데이터 및 시스템 백업 중요한 데이터와 시스템 파티션은 반드시 정기적으로 백업해야 하는데, 문서, 사진 및 음악 백업에 안성맞춤인 오픈소스가 바로 듀플리카티(Duplicati)다. 설치하고 시작하면 백그라운드에서 작동하며, 데이터 선택, 스케줄 등의 구성은 브라우저 인터페이스를 통해 할 수 있다. 하드 디스크, 네트워크 드라이브, USB 스토리지 디바이스 또는 인터넷의 서버를 백업 파일 저장 대상으로 설정할 수 있다. FTP, WebDAV와 같이 잘 알려진 전송 프로토콜 외에 드롭박스, 아마존, 구글과 같은 클라우드 서비스 액세스도 지원한다. 저장된 데이터를 압축하며 AES256으로 암호화한다. 전체 파티션 또는 하드 드라이브 백업에 적합한 또다른 오픈소스 앱이 클론질라(Clonezilla)다. CD 또는 USB 드라이브에 부팅 가능한 복구 시스템을 만든 다음 이를 사용해 하드 디스크 또는 개별 파티션의 이미지를 만든다. 하드웨어 장애가 발생하면 클론질라로 시스템을 재시작하고 이미지 데이터를 복원하면 된다. 백업 저장 대상으로는 로컬 스토리지 기기 또는 네트워크 드라이브를 설정할 수 있다. 클론질라는 NFS 또는 WebDAV를 통해 연결을 설정해 인터넷의 서버로도 데이터를 백업할 수 있다. 한편 문서나 사진을 파일 단위로 공유하는 방법은 많다. 단, 클라우드나 이메일을 통한 공유는 많은 경우 보안 위험이 따르므로, 민감한 데이터의 경우 암호화된 연결을 사용하는 것이 좋다. 이처럼 안전한 파일 교환이 필요할 때 쓸 수 있는 앱이 어니언셰어(Onionshare)다. 어니언셰어는 토르(Tor) 브라우저에 적용돼 사용자 정보를 익명화하는 어니언(Onion) 기술을 활용해 데이터의 안전한 교환을 구현한다. 즉, 전송의 경우 수신자가 검색할 수 있는 어니언 주소를 생성하고, 데이터 암호화 자체가 부가적인 보안을 형성한다. 발신자는 수신자가 전송 잠금을 해제할 수 있는 개인 키를 정의한다. 어니언셰어에는 파일 공유 기능 외에 채팅 옵션과 토르 네트워크를 통해 안전하게 웹사이트를 제공하는 웹 서버 기능도 있다. 그밖에 유용한 오픈소스 애플리케이션 ZIP 형식은 여러 파일을 하나의 패키지로 합치고 데이터를 압축한다. 파일을 압축하면 메일 또는 클라우드를 통해 더 빠르게 전송할 수 있다. 이런 ZIP 압축 프로그램 중 가장 유명한 오픈소스 앱이 7Zip이다. 7Zip은 ZIP 압축 파일을 열고 생성하며 파일을 추가 또는 제거할 수 있고 원하는 경우 윈도우 탐색기의 컨텍스트 메뉴에 통합할 수 있다. 이렇게 하면 ZIP을 열고 만드는 작업을 빠르게 불러올 수 있다. 7Zip을 이용하면 ZIP 파일을 지원할 뿐만 아니라 RAR, TAR, BZIP2, GZ, ARJ, LHA, LZH와 그 외의 많은 형식도 읽을 수 있다. 민감한 데이터가 포함된 파일이라면 AES 크립트(AES Crypt)를 사용해 손쉽게 암호화할 수 있다. 파일을 암호화하면 인터넷을 통해 전송할 때도 안전하게 보호할 수 있다. AES 크립트를 설치하면 윈도우 탐색기의 컨텍스트 메뉴에 새 항목이 생긴다. 암호화를 실행하려면 마우스 오른쪽 버튼으로 하나 이상의 파일을 클릭하고 컨텍스트 메뉴의 “AESCrypt”를 클릭한다. 이후 열리는 창에서 비밀번호를 입력하고 확인을 누르면 된다. 비밀번호를 입력해야만 데이터에 대한 액세스를 허용하는 256비트 보안 파일을 생성한다. 이런 파일을 열려면 마우스 오른쪽 버튼을 다시 클릭하고 AES크립트 항목을 선택한 다음 비밀번호를 입력해야 한다. editor@itworld.co.kr
대규모 언어 모델(LLM)을 기반으로 하는 챗GPT, 클로드(Claude), 바드(Bard)를 비롯한 공용 생성형 AI 챗봇도 충분히 좋지만, 이와 같은 범용 챗봇은 엔터프라이즈 워크플로우에 매끄럽게 통합되지는 않는다. 기업 직원이 별도의 앱을 사용하거나, 회사가 시간과 노력을 들여 애플리케이션 프로그래밍 인터페이스를 통해 자체 애플리케이션에 AI 기능을 추가해야 한다. 또한 챗GPT 및 기타 생성형 AI 챗봇을 사용하기 위해서는 직원이 프롬프트 엔지니어링에 대해서도 배워야 한다. 반면, 임베디드 생성형 AI는 직원이 이 기술을 가장 필요로 하는 곳, 즉 기존 워드 프로세싱 애플리케이션과 스프레드시트, 이메일 클라이언트를 비롯한 기타 엔터프라이즈 생산성 소프트웨어에 새로운 AI 기능을 구현해주며, 이를 위해 회사가 따로 해야 할 일도 없다. 제대로 구현되면 직관적으로, 단절 없이 새로운 AI 기능을 사용할 수 있게 되므로 어려운 생성형 AI 사용법 학습 과정 없이 모든 혜택을 누리게 된다. 포레스터는 최근 북미와 영국의 기술 의사 결정자를 대상으로 한 설문조사 결과를 근거로 2025년까지 거의 모든 기업이 쓰기 및 편집을 포함한 커뮤니케이션 지원 용도로 생성형 AI를 사용하게 될 것으로 예측했다. 실제로 설문 응답자의 70%는 쓰기 또는 편집 작업의 대부분 또는 전체에서 이미 생성형 AI를 사용하고 있다고 답했다. 그러나 포레스터에 따르면 챗GPT 같은 독립적인 생성형 AI 툴은 교차 직무 협업을 지원하지 못하며 직원이 업무를 수행하는 부분에서 작동하지도 않는다. 포레스터는 설문조사 보고서에서 “많은 사용 사례에서 생성형 AI는 독립형 앱보다는 임베디드 기능일 때 더 큰 혜택을 제공한다는 의미”라고 설명했다. IBM 컨설팅의 글로벌 AI 및 분석 부문 리더 매니시 고얄 역시 “아무리 좋은 AI를 가져오더라도 정작 사람들이 워크플로우에서 AI를 사용할 수 없다면 채택되지 않는다"라고 말했다. 임베디드 생성형 AI와 관련하여 현재 가장 큰 화제는 마이크로소프트 365 생산성 제품군 전반에 통합 구축되고 있는 생성형 AI 비서인 마이크로소프트 365 코파일럿이다. 일부 생성형 AI 기능은 팀즈 및 기타 마이크로소프트 365 앱에 구현됐지만 코파일럿 자체는 아직 정식 출시되지 않았고 테스트를 위한 초기 액세스가 허용된 기업은 600개에 불과하다. 마이크로소프트 365 코파일럿의 정식 출시를 손꼽아 기다리고 있는 솔루션 통합업체 인사이트(Insight)의 최고 엔터프라이즈 설계자 겸 CTO 데이비드 맥커디는 “데모를 본 사람이라면 생성형 AI의 통합이 백오피스가 돌아가는 방식을 완전히 바꿔 놓게 될 것임을 알고 있다"라고 말했다. 한편 일부 기업은 오픈AI에 대한 API를 통하거나 라마 2(Llama 2) 같은 LLM을 로컬로 실행해서 자체 앱에 생성형 AI를 직접 추가하고 있다. 예를 들어 인사이트는 API를 통해 마이크로소프트 엑셀에 생성형 AI를 내장했다. 맥커디는 “다만 향후 오피스 365에 통합될 것이기 때문에 이 부분에 대한 개발을 너무 많이 하지는 않고 있다"라고 말했다. 자체 AI 임베드를 만드는 데 필요한 시간이나 인력을 갖추지 못한 기업도 지금 생산성 툴 내에서 생성형 AI 사용을 시작할 수 있다. 많은 업체가 이미 앱에 다양한 생성형 AI 기능을 추가했기 때문이다. 예를 들어 줌, 마이크로소프트 팀즈를 비롯한 여러 온라인 회의 플랫폼은 내장형 또는 애드온 방식으로 AI 기반 요약 기능을 제공한다. 맥커디는 “이 기능이 회의 요약 방식을 완전히 바꾸어 놓았다. 요약 기능이 매우 유용한다는 점은 확실히 말할 수 있다. 큰 이득이 없는 기능도 많지만 요약과 목록 작성만큼은 최고”라고 말했다. 일부 기업에서 워크플로우에 생성형 AI를 어떻게 사용하고 있는지, 어느 부분에서 효과적인지, 그리고 생성형 AI를 안전하게 도입하기 위한 전략은 무엇인지 알아보자. 스트림 파이낸셜 : 이메일, 텍스트 문서, 코드의 생성형 AI 미국 솔트레이크시티에 소재한 핀테크 기업 스트림 파이낸셜 테크놀로지(Stream Financial Technology)의 엔지니어링 책임자인 조완자 조셉은 “우리가 사용하는 스파크(Spark)라는 이메일 클라이언트에는 이메일 요약과 작성을 위한 생성형 AI가 내장돼 있다"라고 말했다. 조셉은 “나도, 경영진도 대부분 긍정적이다. 유일하게 부정적으로 보는 부분은 AI가 이해 부족을 가리는 허울이 될 수 있다는 점이다. 즉, 글을 읽다가 말이 안 되는 부분이 있어서 지적하면 AI가 써서 그렇다고 둘러댈 수 있다는 점”이라고 말했다. 스트림 파이낸셜이 사용하는 또 다른 생성형 AI 툴은 마이크로소프트 워드, 구글 문서도구를 비롯한 많은 애플리케이션 내에서 작동하는 그래멀리(Grammarly)다. 그래멀리는 처음에는 단순한 문법 검사기였지만 최근 AI 기반의 텍스트 생성, 문구 수정 및 요약 기능까지 더했다. 조셉은 “그래멀리 기업 구독을 이용하고 있다. 구글 문서 도구 내에서 작동하며, 단락을 쓰거나 요약하도록 지시할 수 있다. 내용을 채워 넣고 요약하는 용도로는 좋지만 기술적인 분야에 대한 심층적인 내용은 다루지 못한다"라고 말했다. 조셉이 지적한 그래멀리 AI의 문제점은 각각의 상호작용이 별개라는 점이다. 챗GPT, 클로드와 같이 대화를 계속 주고받으면서 결과물을 세밀하게 다듬을 수가 없다. 조셉은 “그래멀리 AI에 무엇을 해야 할지 지시할 좋은 방법이 없다"라고 말했다. 조셉은 회사 측이 기밀 데이터 또는 고객 정보에 대해서는 공용 AI를 사용하지 않도록 주의한다고 강조했다. 조셉은 “장기적 관점에서 생성형 AI를 사용해 마케팅 문구와 같은 콘텐츠를 생성하는 데 대해 낙관적이다. A/B 테스트를 위한 다른 문구를 작성하거나 동일한 문구를 다양한 형태로 반복 생성할 수 있다"라고 말했다. 조셉은 생성형 AI가 가장 크게 영향을 미치는 부분은 코드 생성이라면서 “깃허브 코파일럿에 1인당 월 19달러를 내고 있는데, 그 5배라 해도 기꺼이 낼 것이다. 막대한 시간을 절약할 수 있게 해주며 지식도 상당한 수준”이라고 말했다. 조셉은 “코드 생성은 생성형 AI의 가치가 입증된 부분이다. 그 외의 모든 부분은 아직 단언할 수 없고, 갈 길이 멀다"라고 말했다. NFP : 마케팅 문구, 회의 요약에 생성형 AI 사용 보험 중개업체 NFP는 2년 전부터 텍스트 작성에 AI를 사용해왔다. 이 회사의 영업 지원 부문 SVP인 카일 힐리에 따르면 NFP는 챗GPT가 대중에 공개되기 훨씬 전부터 재스퍼(Jasper) AI를 사용해서 마케팅 문구를 작성했다. 처음 오픈AI의 GPT 3.5 대규모 언어 모델을 기반으로 2021년 2월 출시된 재스퍼는 화이자, 스포츠 일러스트레이티드(Sports Illustrated), 허브스팟(HubSpot), 센티넬원(SentinelOne)을 포함한 10만 곳 이상의 기업 고객을 두고 있다. 현재 재스퍼 AI는 가장 진보된 버전의 챗GPT와 같은 기반 모델인 GPT 4를 사용한다. 여기에 특정 사용 사례에 따라 맞춤화된 마케팅 또는 비즈니스 콘텐츠를 생성하도록 설계된 부가적인 모델과 세부적인 조정 등 비즈니스 친화적인 기능을 추가했다. 또한 회사 자체 브랜드 성격을 학습시키고, 회사 워크플로우 내에서 확장 기능 및 API를 통해 사용할 수 있다. 힐리는 “보안에 대해 일부 우려가 있었다. 그리고 재스퍼는 폐쇄형 시스템이다. 마케팅 부서에서 일부 카피라이팅 작업에 여전히 재스퍼를 사용하고 있다"라고 말했다. 최근 NFP는 재스퍼에서 영업 활동 지원 플랫폼인 세일즈로프트(Salesloft)에 내장된 생성형 AI 툴로 대부분 전환했다. 세일즈로프트는 지난 봄에 빠른 이메일 작성을 위한 생성형 AI 기능을 추가했다. 힐리는 “CRM 시스템의 안내 및 코칭에도 생성형 AI를 사용하기 시작했다. AI 툴이 모든 부분에 연결되기 시작하면서 이제는 더 많은 프로그램에서 GPT를 사용하고 있다. 마이크로소프트 생태계 전반에 완전히 내장된 형태”라고 말했다. 힐리 본인도 생성형 AI를 적극적으로 사용한다. 힐리는 “2023년 비즈니스 계획 전체를 AI를 사용해 작성했다”면서 “AI의 효과에 대해 내부적인 설득 작업을 진행하던 중에 고위직의 누군가가 AI가 아직 그 수준에 이르지 못했다고 말했다. 그래서 오기로 비즈니스 계획을 AI로 만들어서 제출했는데, 반응이 아주 좋았다. 로봇이 작성한 것으로 믿기지 않는다는 반응이었다"라고 말했다. 힐리는 “사모펀드 분야에서 일하는 영업팀의 고위급 직원도 리드를 작성하고 계약을 체결하는 데 AI를 사용하기 시작했다. 올해 초부터 경영진, 영업부서를 비롯해 많은 직원이 AI를 사용하고 있다. 이들은 ‘AI를 채택해야만 한다’고 말한다"라고 전했다. NFP는 마이크로소프트 팀즈에서도 생성형 AI를 사용해서 회의 노트를 자동으로 생성한다. 힐리는 “모두가 이해해야 할 중요한 점은 AI가 우리 일을 대체하는 것이 아니라 증폭하고 보강한다는 것이다. 같은 수의 사람으로 더 많은 일을 할 수 있게 해준다"라고 말했다. 힐리는 다음 단계는 세일즈포스의 생성형 AI 기능을 사용해서 원시 데이터를 해설적 데이터로 바꾸는 것이라며 “지금 이 부분을 추진하고 있다. 이를 통해 경영진은 자연스럽게 느껴지는 방식으로 정보를 흡수할 수 있게 된다. 예를 들어 나처럼 숫자에 서툴고 항상 숫자에서 막힌다면 숫자가 아닌 다른 방식으로 정보를 흡수할 수 있게 될 것”이라고 말했다. 생성형 AI 툴을 사용할지 여부를 결정할 때 중요한 것은 학습 데이터의 정확성과 개인정보 보호, 보안, 그리고 사용성이다. 힐리는 “영업 및 마케팅 문구에서는 사유 부분을 다루지 않는다. 그러나 NFP는 인수합병을 많이 한다. 법무팀이 AI를 사용해서 계약서를 더 빠르게 만들거나 미묘한 차이 또는 세부 사항을 찾을 수 있을까? 개인정보 보호와 보안, 클로즈드 소스 모델을 살펴봐야 한다"라고 말했다. 힐리는 지금은 영업 담당자가 새로운 AI 툴을 익히도록 하는 작업을 진행 중이라면서 “간소함과 사용의 용이함이 중요하다. 자연스럽게 느껴지는지, 마음을 먹고 사용법을 배워야 하는지가 관건”이라고 말했다. 힐리는 예를 들어 챗GPT는 사용하기가 쉽지 않았다면서 “챗GPT에 말을 하기 위해서는 거의 정해진 코스에 따라야 한다. 어떤 면에서는 프로그래밍과 상당히 비슷하다. 하지만 NFP는 기술 기업이 아니고 보험을 판매하는 회사”라고 말했다. 직원이 이미 사용하는 툴에 내장된 형태의 생성형 AI는 이러한 사용성 장벽을 극복하는 데 도움이 될 수 있다. 힐리는 “예를 들어 세일즈로프트는 반복적이고 유기적이다. 생성형 AI는 이 툴의 자연스러운 확장이다. 새로운 것을 배울 필요가 없다는 것이 NFP에는 중요한 점이다. 35년째 일하는 보험 담당자도 바로 사용할 수 있고, 25세 직원이라면 시스템 전체를 지극히 자연스럽게 받아들인다"라고 말했다. 톰슨 로이터 : 서신 초안 작성, 직원 질문에 대한 응답에 생성형 AI 사용 뉴스 기업 톰슨 로이터(Thomson Reuters)의 최고 인사 책임자인 매리 앨리스 부이식은 수십년 전부터 제품과 사무실에서 AI를 사용해왔다면서 “이미 존재하는 많은 부분에 AI가 내장돼 있다. 핵심은 증강, 즉 사람들이 더 가치 있는 일을 할 수 있도록 해주는 데 있다"라고 말했다. 부이식은 AI는 사람이 아니라 “작업을 대체한다"라고 말했다. 생성형 AI가 보편화된 지금 톰슨 로이터는 선제적으로 공급업체에 관심을 갖고 이들의 AI 로드맵을 살펴봤다. 부이식은 이미 많은 부분이 발표됐다고 말했다. 예를 들어 세일즈포스와 워크데이(Workday) 모두 생성형 AI 전략을 마련했다. 부이식은 “마이크로소프트 코파일럿과 그 외에도 수많은 툴이 있다"라고 말했다. 부이식은 톰슨 로이터에서 이미 많은 생성형 AI 툴이 사용되고 있다고 말했다. 예를 들어 커뮤니케이션 팀은 AI를 사용해서 문서의 초안을 작성한다. “실제로 작업의 첫 번째 초안 작성에서 전반적으로 AI 툴을 사용할 여지가 있다. 다만 정확성은 AI에 의지할 수 없고 교육에서도 이 부분을 다뤘다. 처음 초안이 작성된 다음에는 사람이 편집한다. 즉, 사람의 전문성을 적용해서 더 높은 품질의 제품을 제공한다"라고 말했다. HR 분야에서는 생성형 AI를 사용해 직원 질문에 답하기와 관련한 실험이 진행 중이다. 부이식은 “초기 결과는 매우 만족스럽다. 지금까지 정확도는 95%이며 과거 이러한 질문에 답하느라 빼앗겼던 시간을 돌려줘서 부가가치를 창출하는 일에 투자할 수 있게 해준다"라고 말했다. 생성형 AI 도입을 위한 세 갈래 접근 부이식은 톰슨 로이터는 가능성에서 앞서 나가기 위해 AI 도입을 가속화하기 위한 전사적 이니셔티브를 출범했다고 말했다. 첫 번째 단계는 AI 표준과 윤리의 정립으로, 몇 년 전부터 해오고 있다. 부이식은 “톰슨 로이터는 30년 이상 AI를 사용하고 있다. 생성형 AI 이전에도 이 분야의 리더가 되기 위해 노력했다"라고 말했다. 부이식은 “다음 단계는 인력 교육이다. 이는 반드시 필요한 단계”라고 말했다. 톰슨 로이터는 지난 4월 전세계 모든 직원이 참여할 수 있는 AI 교육의 날을 열었다. 총 2만 7,000명의 직원 중 약 7,000명이 라이브로 이 이벤트에 참석했다. 부이식은 “그 외에도 수천 명이 비동기적으로 이 교육 자료를 활용하고 있다"라고 덧붙였다. 부이식에 따르면 참가자의 대다수는 이미 자신의 업무에 생성형 AI를 적용할 수 있다고 말했다. 부이식은 “이는 로이터 직원 대부분이 앞으로 일하면서 겪게 될 가장 중요한 혁신이다. 우리는 이 부분에서 선두에 서야 한다. 회사 측은 교육과 개발, 업스킬 및 리스킬에 대한 책임이 있다. 그러나 모든 개인도 배우고 발전해야 할 책임이 있다"라고 말했다. 톰슨 로이터 AI 전략의 세 번째 축은 모든 툴을 실험할 수 있는 안전한 장소를 제공하는 것이다. 부이식에 따르면 톰슨 로이터는 생산성 소프트웨어에 내장된 생성형 AI 외에도 오픈AI, 앤트로픽, 구글, 그리고 라마 2와 같은 오픈소스 모델을 포함한 다양한 대규모 언어 모델을 실험하고 있다. 부이식은 “변화의 속도가 매우 빠르다. 톰슨 로이터는 고객 사용 사례를 위해 최선의 기술을 활용하고자 한다"라고 말했다. 마지막으로, 이 회사는 학습과 실험의 문화를 강화하고 있다. 부이식은 “가장 빠르게 배우고 실험하는 팀이 승리하게 될 것”이라고 말했다. 위험을 고려해서 현명하게 선택하기 몇몇 엔터프라이즈 기술 업체는 생성형 AI 기능뿐만 아니라 모델을 학습시키는 방법 또는 사용할 구체적인 모델에 관한 유연함도 고객에 제공한다. IBM 컨설팅의 고얄은 “IBM은 세일즈포스를 사용한다. IBM의 세일즈포스 관리자는 나와 같은 최종 사용자가 그냥 볼 수 있도록 적절한 모델을 선택하고 구성할 수 있다. 세일즈포스는 임베디드 AI를 선택할 수 있는 옵션도 제공한다"라고 말했다. 고얄은 IBM 컨설턴트가 현재 기업과 협력해서 마이크로소프트 365를 비롯한 과련 기술로 무엇이 가능한지, 그리고 법률 및 보안 측면에서 생성형 AI가 어떤 영향을 미치는지에 대해 생각하도록 돕고 있다고 말했다. 고얄은 “IBM의 왓슨x(Watsonx)에 대한 입장은 확고하다. 고객의 데이터는 고객의 소유라는 것이다. IBM은 모델 학습에 고객 데이터를 절대 사용하지 않는다. 애저, AWS, 구글과 협력하고 있으며 이들 각 기업은 생성형 AI의 이 부분에 있어 예전부터 명확한 입장을 유지하고 있다. IBM의 파트너 및 고객 역시 마찬가지다. 고객이 업로드하거나 서비스에 사용하는 어떠한 데이터도 모델 학습에 사용되지 않는다. 그렇지 않으면 어떤 기업도 AI를 사용하지 않을 것”이라고 말했다. 이 원칙을 위반한 엔터프라이즈 업체의 예로 줌이 있다. 줌은 처음에 회의 녹취록을 AI 학습에 사용할 것이라고 말했다가 격렬한 반발에 직면해 황급히 철회한 바 있다. 그러나 초기 학습 데이터의 출처에 대해서는 업체의 투명성이 부족하다. 고얄도 그 점을 인정하면서 “왓슨x는 학습 데이터에 대한 완전한 데이터 계보를 제공한다. 그러나 모든 업체가 그렇지는 않다. 명확하게 밝히지 않는 경우가 많다"라고 말했다. 또한 몇몇 AI 업체는 저작권이 있는 상품을 허가 없이 AI 학습에 사용했다는 이유로 아티스트 및 작가로부터 피소된 상황이다. 고얄은 “AI에는 항상 위험이 있었다"라고 말했다. 대규모 언어 모델에는 과거의 오래된 위험이 더 증폭된 경우도 있고 새로운 위험도 있다. 고얄은 “기업은 생성형 AI를 사용할 때 가드레일을 설치해야 한다"라고 말했다. 그러나 기업에 결국 중요한 것은 이러한 새로운 기능을 어떻게 사용할 수 있을지를 살펴보는 것이다. 고얄은 “그 방법을 가장 빠르게 파악하는 기업이 승자가 되고 꿈처럼 보이는 일을 현실화할 수 있을 것”이라고 말했다. editor@itworld.co.kr
파이썬은 강력하고 유연하며 다루기 쉬운 언어로 유명하다. 이런 장점 때문에 방대하고 다양한 애플리케이션과 워크플로우, 분야에 사용된다. 그러나 인터프리티드 언어인 데다 런타임의 동적 특성 때문에 파이썬은 C, C++와 같은 머신 네이티브 언어에 비해 속도가 훨씬 더 느리다는 고질적인 단점이 있다. 개발자들은 오랜 시간 동안 파이썬의 속도 제한을 극복하기 위한 다양한 방법을 고민해왔다. 예를 들어 성능 집약적인 작업을 C로 작성하고 이 C 코드를 파이썬으로 래핑하는 방법 같은 것이다. 많은 머신러닝 라이브러리가 실제로 이 방식으로 동작한다. 또는 파이썬 코드에 런타임 형식 정보를 섞어 C로 컴파일할 수 있게 해주는 프로젝트인 사이썬(Cython)을 사용하는 방법도 있다. 그러나 차선책은 이상적인 방법일 수는 없다. 그냥 파이썬 프로그램을 그대로 가져와 훨씬 더 빠르게 실행할 수 있다면 좋지 않을까? 그 대답이 바로 파이파이(PyPy)다. 파이파이 vs. C파이썬 파이파이는 기본 파이썬 인터프리터인 C파이썬(CPython)을 대체한다. C파이썬은 파이썬을 중간 바이트코드로 컴파일하고 이 바이트코드가 가상머신에 의해 인터프리트되는 방식인 데 반해, 파이파이는 JIT(JustInTime) 컴파일을 사용해 파이썬 코드를 머신 네이티브 어셈블리어로 변환한다. 수행하는 작업에 따라 상당한 정도의 성능 향상이 가능하다. 평균적으로 파이파이는 파이썬 3.7에 비해 파이썬 속도를 약 4.7배 더 높여주며 일부 작업에서는 50배 이상의 속도 향상이 가능하다. 새로운 버전의 C파이썬 인터프리터에도 특정 종류의 JIT 최적화가 추가되고 있지만 현재 파이파이의 범위와 효과에 비할 바는 아니다. 앞으로 대등해질 가능성을 배제할 수 없지만 적어도 지금은 아니다. 가장 좋은 점은 파이파이가 제공하는 효과를 얻기 위해 개발자가 따로 해야 할 일이 거의 없다는 것이다. C파이썬을 파이파이로 바꾸기만 하면 된다. (다음에서 설명할) 몇 가지 예외는 있지만 파이파이의 공식적인 목표는 기존의 파이썬 코드를 수정 없이 실행하면서 자동으로 속도를 높여주는 것이다. 현재 파이파이는 파이썬 2와 파이썬 3을 각기 다른 프로젝트 구현으로 모두 지원한다. 즉, 실행할 파이썬의 버전에 따라 다른 버전의 파이파이를 다운로드해야 한다. 파이파이의 파이썬 2 브랜치가 나온 시점이 훨씬 더 오래됐지만 파이썬 3 버전도 최근 거의 따라잡았다. 현재 파이썬 버전 3.9까지 지원하며 파이썬 3.10은 실험 수준에서 지원된다. 파이파이는 모든 핵심 파이썬 언어를 지원하는 것 외에, 패키징을 위한 pip, 가상 환경을 위한 virtualenv 등 파이썬 생태계의 방대한 툴과도 호환된다. C 모듈을 사용하는 패키지를 포함해 대부분의 파이썬 패키지는 변경 없이 그대로 동작한다. 물론 일부 제한도 있다. 이는 아래에서 살펴본다. 파이파이의 작동 방식 파이파이는 동적 언어를 위한 다른 JIT 컴파일러에도 있는 최적화 기법을 사용한다. 실행 중인 파이썬 프로그램을 분석하면서 생성 및 사용되는 객체의 형식 정보를 판단한 후 이 형식 정보를 가이드 삼아 속도를 높인다. 예를 들어 파이썬 함수가 한두 개의 객체 형식에서만 작동한다면 파이파이는 이러한 특정 사례를 처리하는 기계 코드를 생성한다. 파이파이의 최적화는 런타임에서 자동으로 처리되므로 일반적으로는 개발자가 직접 성능을 조정할 필요가 없다. 고급 사용자라면 파이파이의 명령줄 옵션을 변경하면서 특수한 사례를 위한 더 빠른 코드를 생성할 수 있지만 그럴 필요까지는 거의 없다. 또한 파이파이는 몇몇 내부 함수를 처리하는 방식도 C파이썬과 다르지만 동작의 호환성을 유지하려고 노력한다. 예를 들어 파이파이의 가비지 수집 방식은 C파이썬과 달라서 범위에서 벗어나는 모든 객체가 즉각 수집되지는 않으므로 파이파이로 실행되는 파이썬 프로그램은 C파이썬으로 실행되는 경우에 비해 메모리 사용량이 더 높게 표시될 수 있다. 그러나 gc 모듈을 통해 노출되는 gc.enable(), gc.disable(), gc.collect()와 같은 파이썬의 고수준 가비지 수집 컨트롤을 여전히 사용할 수 있다. 파이파이의 JIT 동작에 대한 정보가 필요하다면 파이파이에 포함된, 파이썬 애플리케이션에 대한 많은 JIT 후크를 노출하는 pypyjit라는 모듈을 활용하면 된다. JIT에서 성능이 떨어지는 함수 또는 모듈이 있는 경우 pypyjit를 사용해 세부적인 통계를 확인할 수 있다. 또 다른 파이파이 전용 모듈인 __pypy__는 파이파이만의 다른 기능을 노출하며 해당 기능을 활용하는 애플리케이션을 작성하는 데 유용하다. 파이썬의 런타임 동적 특성 덕분에 파이파이가 있을 때 이러한 기능을 사용하고, 없을 때는 무시하는 파이썬 애플리케이션을 만드는 것이 가능하다. 파이파이의 제약 파이파이는 매우 강력하지만 제약도 있다. 파이파이는 기본 C파이썬 런타임에 대한 완전한 범용 대체재는 아니다. 몇 가지 제약으로 인해 특정 종류의 프로그램에서는 파이파이의 효과가 줄어들거나 아예 사라진다. 가장 중요한 제한 사항은 다음과 같다. 파이파이는 순수 파이썬 앱에서 가장 효과적 : 파이파이는 전통적으로 “순수” 파이썬 애플리케이션, 즉 다른 언어 없이 파이썬만으로 작성된 애플리케이션에서 최고의 효과를 발휘했다. 넘파이(NumPy)와 같이 C 라이브러리와 접촉하는 파이썬 패키지는 파이파이가 C파이썬의 네이티브 바이너리 인터페이스를 에뮬레이션하는 방식상 좋은 결과를 얻지 못했다. 파이파이 개발자들은 그동안 이 문제를 줄여 나가면서 C 확장에 의존하는 대다수 파이썬 패키지와의 호환성을 더 높였다. 예를 들어 넘파이는 지금은 파이파이에서 매우 잘 작동한다. 그러나 최대한의 C 확장 호환성을 원한다면 C파이썬을 사용해야 한다. 파이파이는 장기간 실행되는 프로그램에서 가장 효과적 : 파이파이가 파이썬 프로그램을 최적화하는 방법의 특성상 장시간 실행되는 프로그램이 최적화 효과를 가장 많이 얻는다. 프로그램 실행 시간이 길수록 파이파이는 런타임 형식 정보를 더 많이 얻을 수 있고 최적화도 더 많이 할 수 있기 때문이다. 단발성 파이썬 스크립트는 이러한 혜택을 얻지 못한다. 이 효과를 얻는 애플리케이션은 일반적으로 오랜 시간 실행되는 루프가 있거나 백그라운드에서 지속적으로 실행되는 웹 프레임워크 같은 애플리케이션이다. 파이파이는 AOT 컴파일을 하지 못함 : 파이파이는 파이썬 코드를 컴파일하지만 파이썬 코드용 컴파일러는 아니다. 파이파이의 최적화 수행 방법과 파이썬의 태생적인 동적 특성으로 인해 JIT 코드를 독립형 바이너리로 배출해서 재사용할 방법이 없다. 즉, 이 문서에 설명돼 있듯이 각 프로그램이 실행될 때마다 매번 컴파일해야 한다. 파이썬을 독립형 애플리케이션으로 실행할 수 있는 더 빠른 코드로 컴파일하고 싶다면 사이썬, 넘바(Numba), 또는 현재 실험 단계인 누이트카(Nuitka) 프로젝트를 사용해야 한다. editor@itworld.co.kr
머신러닝(Machine learning)과 딥러닝(deep learning)은 널리 알려진 익숙한 용어지만, 이런 유명세 만큼이나 더 폭넓은 오해를 받는 부분도 있다. 여기서는 한 걸음 물러서서 머신러닝과 딥러닝의 기본을 살펴보고, 가장 보편적인 몇 가지 머신러닝 알고리즘을 알아본다. 이런 알고리즘이 역사적 데이터로부터 예측 모델을 만들기 위한 퍼즐의 다른 조각과 어떻게 관련되는지도 설명한다. 머신러닝 알고리즘이란 머신러닝은 데이터로부터 자동으로 모델을 생성하는 방법이고, 머신러닝 알고리즘은 머신러닝을 움직이는 엔진이다. 즉, 데이터 집합을 모델로 바꿔주는 알고리즘이다. 지도, 비지도, 분류, 회귀 등 어떤 알고리즘이 가장 효과적인지는 해결하려는 문제의 종류, 가용한 컴퓨팅 리소스, 데이터의 속성에 따라 달라진다. 머신러닝의 작동 원리 일반적인 프로그래밍 알고리즘은 컴퓨터에 해야 할 일을 간단한 방식으로 알려준다. 예를 들어 정렬 알고리즘은 정렬되지 않은 데이터를 데이터에 있는 하나 이상 필드의 숫자 또는 알파벳 순서 등 특정 기준에 따라 정렬된 데이터로 변환한다. 선형 회귀 알고리즘은 직선, 또는 다항식과 같이 매개변수가 선형인 다른 함수를 수치 데이터에 맞추는데, 이를 위해 일반적으로 사용하는 방법은 선과 데이터 간의 제곱 오차를 최소화하기 위해 행렬 역변환을 수행하는 것이다. 제곱 오차를 척도로 사용하는 이유는 회귀선이 데이터 포인트 위에 있는지, 아래에 있는지는 중요하지 않기 때문이다. 중요한 것은 선과 포인트 간의 거리다. 매개변수가 선형이 아닌 곡선을 데이터에 맞추는 비선형 회귀 알고리즘은 조금 더 복잡하다. 선형 회귀 문제와 달리 결정론적 방법으로 해결할 수 없기 때문이다. 대신 비선형 회귀 알고리즘은 일종의 반복적 최소화 프로세스를 구현하는데, 이는 급속 하강(steepest descent) 방법의 변형인 경우가 많다. 급속 하강은 기본적으로 현재 매개변수 값에서 제곱 오차와 그 기울기를 계산하고, 단계 크기 즉, 학습률을 선택하고, 기울기 방향을 "아래로" 따라간 다음, 새로운 매개변수 값에서 제곱 오차와 그 기울기를 다시 계산한다. 운이 좋다면 최종적으로 이 과정은 수렴한다. 급속 하강에는 수렴 속성을 개선하고자 하는 여러 변형이 있다. 머신러닝 알고리즘은 비선형 회귀보다도 더 복잡한데, 머신러닝은 다항식과 같은 특정 수학 함수에 맞추는 제약이 없다는 점도 그 이유 중 하나다. 머신러닝이 해결하는 대표적인 두 가지 문제 범주는 회귀와 분류다. 회귀는 수치 데이터, 분류는 비수치 데이터에 사용된다. 전자는 특정 주소와 직업을 가진 사람의 예상 수입은 어느 정도인가와 같은 문제, 후자는 대출 신청자가 이 대출을 상환하지 않을 것인가와 같은 문제다. 예측 문제(“내일 마이크로소프트 주식의 시초가는 얼마가 될까?”)는 시계열 데이터에 대한 회귀 문제의 하위 집합이다. 분류 문제는 이진(예/아니요), 다중 범주 문제(동물, 채소 또는 광물)로 나뉘기도 한다. 지도 학습 vs. 비지도 학습 이러한 구분과 별개로 머신러닝 알고리즘에는 지도와 비지도, 2가지 종류가 있다. 지도 학습에서는 동물 이름이 딸린 일련의 동물 사진과 같은, 답변이 포함된 학습 데이터 집합을 제공한다. 이 학습의 목표는 이전에 본 적이 없는 사진을 올바르게 식별(학습 집합에 포함된 동물의 종류)할 수 있는 모델을 만드는 것이다. 비지도 학습에서는 알고리즘이 스스로 데이터를 살펴보고 유의미한 결과를 도출하려고 시도한다. 예를 들어 각 클러스터 내에서 연관될 수 있는 데이터 포인트의 클러스터 집합이 결과로 나올 수 있다. 클러스터가 겹치지 않을 때 더 효과적으로 작동한다. 학습과 평가를 통해 매개변수를 최적화해 데이터의 기준 진실과 가장 잘 일치하는 값 집합을 찾음으로써 지도 학습 알고리즘을 모델로 바꾼다. 알고리즘은 옵타마이저를 위해 예를 들어 확률적 경사 하강(SGD: 무작위 시작점에서 여러 번 수행되는 급속 하강이라고 할 수 있음)과 같은 급속 하강의 변형에 의존하는 경우가 많다. SGD의 일반적인 개선 방법은 운동량을 기반으로 경사의 방향을 수정하거나, 한 데이터 패스(에포크라고 함)에서 다음 패스로의 진행에 따라 학습률을 조정하는 요소를 추가하는 것이다. 머신러닝을 위한 데이터 정제 자연 상태에서 깨끗한 데이터는 존재하지 않는다. 머신러닝에 사용하려면 데이터를 적극적으로 필터링해야 한다. 예를 들면 다음과 같다. 데이터를 살펴보고 누락된 데이터가 많은 열을 제외한다. 데이터를 다시 살펴보면서 예측에 사용할 열을 선택한다. 이 열은 반복할 때 바꾸는 경우가 많다. 나머지 열에서 여전히 누락된 데이터가 있는 행을 제외한다. 명백한 오타를 교정하고 동일한 답변을 병합한다. 예를 들어 U.S. US. USA, 미국은 하나의 범주로 병합해야 한다. 범위를 벗어난 데이터가 있는 행을 제외한다. 예를 들어 뉴욕시 내의 택시 이동을 분석한다면 뉴욕시 경계 상자를 벗어난 승하차 위도 및 경도는 필터링으로 걸러낸다. 그 외에도 할 수 있는 일이 많지만 이는 수집된 데이터에 따라 달라진다. 지루한 작업일 수 있으나 머신러닝 파이프라인에 데이터 정제 단계를 두면 자유롭게 수정하고 반복할 수 있다. 머신러닝을 위한 데이터 인코딩 및 정규화 머신 분류를 위해 범주 데이터를 사용하려면 텍스트 레이블을 다른 양식으로 인코딩해야 한다. 일반적으로 2가지 인코딩이 사용된다. 첫째는 레이블 인코딩으로, 각 텍스트 레이블이 숫자로 대체된다. 둘째는 원핫(onehot) 인코딩으로, 각 텍스트 레이블 값이 이진 값(1 또는 0)이 있는 열로 변환된다. 대부분의 머신러닝 프레임워크에는 이 같은 변환을 수행하는 함수가 있다. 레이블 인코딩의 경우 머신러닝 알고리즘이 혼동해서 인코딩된 열이 정렬된 것으로 착각할 수 있으므로 일반적으로 원핫 인코딩이 선호된다. 머신 회귀에 숫자 데이터를 사용하려면 일반적으로 데이터를 정규화해야 한다. 그렇지 않으면 범위가 큰 숫자가 특징 벡터 간의 유클리드 거리를 지배하는 경향이 있고, 이들의 효과가 확대되면서 다른 필드가 희생되고 급속 하강 최적화가 잘 수렴되지 않을 수 있다. ML을 위해 데이터를 정규화 및 표준화하는 방법은 최소최대 정규화, 평균 정규화, 표준화, 단위 길이로 스케일링 등 여러 가지가 있다. 이 프로세스를 보통 특징 스케일링(feature scaling)이라고 한다. 머신러닝 특징 앞에서 언급한 특징(feature) 벡터가 무엇인지 알아보자. 우선, 특징이란 관찰 대상 현상의 측정 가능한 개별적인 속성 또는 특성이다. “특징”이라는 개념은 선형 회귀와 같은 통계 기법에서 사용되는 설명 변수와 관계가 있다. 특징 벡터는 한 행의 모든 특징을 하나의 숫자 벡터로 결합한다. 특징을 선택하는 기법 중 하나는 문제를 설명하는 최소 독립 변수 집합을 선택하는 것이다. 두 변수가 고도로 상호 연관된다면 하나의 특징으로 결합해야 하거나 하나를 삭제해야 한다. 주성분 분석을 수행하여 상호 연관된 여러 변수를 선형적으로 상호 연관되지 않은 변수들의 집합으로 변환하는 경우도 종종 있다. 새로운 특징을 구축하거나 특징 벡터의 차원을 축소하기 위해 사용하는 변환 방법 중에서 간단한 방법도 몇 가지 있다. 예를 들어 Year of Death에서 Year of Birth를 빼면 수명 및 사망 분석을 위한 주요 독립 변수인 Age at Death를 구축할 수 있다. 특징 구축이 명확하지 않은 경우도 있다. 일반적인 머신러닝 알고리즘 머신러닝 알고리즘은 선형 회귀와 로지스틱 회귀부터 심층 신경망 및 앙상블(다른 모델의 조합)에 이르기까지 수십 가지가 있지만 가장 일반적인 알고리즘은 다음과 같다. 선형 회귀 또는 최소 제곱 회귀(숫자 데이터) 로지스틱 회귀(이진 분류) 선형 판별 분석(다중 범주 분류) 결정 트리(분류와 회귀) 나이브 베이즈(분류와 회귀) K최근접 이웃(KNN, 분류와 회귀) 학습 벡터 양자화(LVQ, 분류와 회귀) 서포트 벡터 머신(SVM, 이진 분류) 랜덤 포레스트, “배깅” 앙상블 알고리즘의 한 유형(분류와 회귀) 부스팅 방법(AdaBoost 및 XGBoost 포함)은 일련의 모델을 생성하는 앙상블 알고리즘으로, 각각의 새로운 모델이 이전 모델의 오류를 수정하려고 시도 흔히 듣는 신경망과 심층 신경망은 어디에 있을까? 이 둘은 대체로 계산 집약적이라서 GPU 또는 다른 특수한 하드웨어가 필요하므로 비교적 단순한 알고리즘에는 맞지 않는 이미지 분류, 음성 인식과 같은 특수한 문제에만 사용해야 한다. 위에서 “심층”은 신경망 안에 숨은 계층이 많다는 것을 의미한다. 신경망과 심층 신경망에 대한 더 자세한 내용은 “딥러닝의 진정한 의미”를 참고하면 된다. 머신러닝 알고리즘의 초매개변수 머신러닝 알고리즘은 데이터로 학습해서 예측된 값 또는 클래스에 영향을 미치는 각 독립 변수에 대한 최적의 가중치 집합을 찾는다. 알고리즘 자체에는 초매개변수(hyperparameters)라는 변수가 있다. 결정되는 가중치가 아니라 알고리즘의 작동을 제어하기 때문에 매개변수가 아닌 초매개변수로 불린다. 많은 경우 가장 중요한 초매개변수는 학습률이다. 학습률은 최적화에서 다음에 시도할 가중치 집합을 찾을 때 사용되는 단계 크기를 결정한다. 학습률이 너무 높으면 경사 하강이 평지(plateau) 또는 비최적 지점에 빠르게 수렴할 수 있고, 학습률이 너무 낮으면 경사 하강이 정체되어 완전히 수렴하지 않을 수 있다. 다른 많은 일반적인 초매개변수는 사용되는 알고리즘에 따라 달라진다. 대부분 알고리즘에는 최대 에포크 수, 또는 최대 실행 시간, 에포크 간 최소 개선과 같은 중지 매개변수가 있다. 특정 알고리즘에는 검색의 형태를 제어하는 초매개변수가 있다. 예를 들어 랜덤 포레스트에는 리프당 최소 샘플 수, 최대 깊이, 분할 시 최소 샘플 수, 리프의 최소 가중치 비율, 그 외에 8가지에 대한 초매개변수가 있다. 초매개변수 튜닝 여러 프로덕션 머신러닝 플랫폼이 현재 자동 초매개변수 튜닝을 제공한다. 기본적으로 시스템에 변경할 초매개변수와 최적화하고자 하는 메트릭을 알려주면 시스템은 허용되는 만큼 많은 실행 횟수에 걸쳐 이러한 초매개변수를 스윕한다. 단, 구글 클라우드 초매개변수 튜닝은 텐서플로우 모델에서 적절한 메트릭을 추출하므로 직접 지정할 필요가 없다. 초매개변수 스위핑을 위한 검색 알고리즘에는 베이지안(Bayesian) 최적화, 그리드(grid) 검색, 무작위 검색의 3가지가 있다. 베이지안 최적화가 대체로 가장 효율적이다. 최대한 많은 초매개변수를 튜닝해야 최선의 답을 얻는다고 생각할 수 있다. 그러나 개인 하드웨어에서 실행하는 경우가 아닌 한 비용이 상당히 커질 수 있고, 어떤 경우든 얻는 이득은 점점 줄어든다. 자신의 데이터와 선택한 알고리즘에서 가장 중요한 초매개변수는 경험을 통해 발견할 수 있다. 자동 머신러닝 알고리즘 선택에 대해 말하자면, 어느 알고리즘 또는 알고리즘 앙상블이 현재 데이터에 맞는 최선의 모델을 제공할지 아는 방법은 하나밖에 없다. 모두 시도해 보는 것이다. 여기서 가능한 모든 정규화 및 특징 선택까지 시도한다면 조합의 수는 폭발적으로 증가한다. 모든 것을 수동으로 시도한다는 것은 비현실적이므로, 당연히 머신러닝 툴 제공업체들은 많은 노력을 기울여 오토ML(AutoML) 시스템을 출시했다. 우수한 시스템은 특징 공학과 알고리즘 및 정규화에 대한 스윕을 결합한다. 최선의 모델에 대한 초매개변수 튜닝은 나중을 위해 남겨두는 경우가 많다. 다만 특징 공학은 자동화하기 어려운 문제이며 이 부분을 다루지 않는 오토ML 시스템도 있다. 요약하자면, 머신러닝 알고리즘은 머신러닝 퍼즐의 한 조각일 뿐이다. 알고리즘 선택(수동 또는 자동) 외에도 옵티마이저, 데이터 정제, 특징 선택, 특징 정규화, 그리고 선택적으로 초매개변수 튜닝까지 처리해야 한다. 이 모든 부분을 처리하고 데이터에 맞는 모델을 구축했다면, 이제 모델을 배포하고 조건의 변화에 따라 업데이트할 차례다. 프로덕션의 머신러닝 모델을 관리하는 것은 또 다른 문제다. editor@itworld.co.kr
최신 윈도우 11 기능을 따라가다 보면 쉽게 혼란스러워진다. 마이크로소프트 빌드(Microsoft Build) 행사와 함께 새로운 기능이 끊임없이 쏟아지는 5월에는 더욱 그렇다. 올해도 마찬가지였다. 마이크로소프트는 실용적인 것부터 이상적인 것까지 빌드 행사에서 다양한 윈도우 11 기능을 쏟아냈다. 올해 빌드 행사에서는 윈도우 11의 모멘트 3(Moment 3)과 함께 흥미로운 새 기능이 공개됐고 향후 출시될 더 많은 기능에 대한 힌트도 얻을 수 있었다. 다만 소규모 기능 업데이트인 모멘트는 언제든 배포될 수 있기 때문에 출시 시기는 달라질 수 있다. 현재 모멘트 3에 도입될 것으로 알려진, 그리고 사용자 PC에 배포될 여러 새 기능을 간단히 설명한다. 윈도우 11 모멘트 3의 기능들 이제부터 소개할 모멘트 3 기능은 기본 기능이 아니라 옵션이며, 새로운 기능을 출시 즉시 받겠다고 미리 설정하지 않은 이상 6월 이후에야 배포된다. 2023년 6월, 아마도 패치 화요일 주기를 고려하면 6월 13일쯤 윈도우 11 비보안 프리뷰 릴리즈에 추가 선택 형식으로 배포될 예정이다. 새로운 기능을 한발 먼저 사용하는 것을 좋아하고 최신 업데이트가 출시되는 즉시 받고 싶은 사용자라면 윈도우 11 설정 앱의 ‘윈도우 업데이트 항목’으로 이동한다. 여기서 ‘최신 업데이트가 제공되는 즉시 받기’ 메뉴의 토글을 켠다. 마이크로소프트는 사용자의 삶의 질을 조금씩 개선하는 기능을 단계적으로 릴리즈한다. 모멘트 3 역시 마찬가지다. 마이크로소프트는 이달 초 이들 기능을 윈도우 참가자 프로그램 22621.1776(릴리즈 채널) 베타 일부분으로 테스트했고 이제 최종 릴리즈로 배포했다. 더 넓은 위젯 창 : 윈도우 11에 추가된 흥미로운 변화는 사용자가 앱을 더 많이 설정할 수 있도록 많은 공간을 확보하는 위젯의 변화다. 위젯은 2개가 아닌 3개 열로 더 넓어지고 개인화할 수 있다. 마이크로소프트가 공개한 새로운 위젯 선택기를 보면 사용자는 자신이 선택한 위젯이 어떤 모습으로 나타날지 미리 볼 수 있으며, 더 많은 위젯을 찾을 수 있다(위젯 선택기는 조금 늦게 배포될 수 있다). 센서 설정 : 일부 노트북은 사용자가 자리를 비우거나 보안을 위해 PC를 잠가 둘 경우 화면을 자동으로 어둡게 조정하는 존재 감지 센서가 있다. 설정 개인정보 보호 및 보안 감지 센서에서 관리할 수 있다. VPN 아이콘 : 이제 VPN을 사용할 때 작업표시줄에 작은 방패 아이콘이 나타난다. USB4 허브 및 설정 : 인텔 기반 노트북은 보통 썬더볼트 독과 연결된다. 그러나 USB4는 AMD 라이젠 노트북에서 거의 동일한 기능을 수행한다. 어떤 것이든 새로운 윈도우 설정 페이지에서는 노트북의 USB4 기능과 연결된 주변장치의 정보를 알 수 있다. 블루투스 지원 확대 : 윈도우 11은 이제 갤럭시 버드2나 버드2 프로 같은 이어폰에서 지원하는 저전력 오디오 표준인 블루투스 저전력 오디오(Bluetooth Low Energy Audio)를 지원한다. 계정 아이콘 배지 : 시작 메뉴의 계정 아이콘에 작은 느낌표가 나타나면 마이크로소프트 계정 관리에 주의가 필요하다는 뜻이다. 다른 윈도우 기능에 대한 유용한 알림(즉, 광고)과 연결되어 있다. 라이브 자막 언어 확대 : 자막이 없는 콘텐츠에 자막을 자동으로 제공한다. 라이브 자막은 중국어, 다양한 영어 방언, 프랑스어, 독일어, 스페인어 등을 지원한다. 마이크로소프트가 이전 프리뷰에서 공개한 내용을 기반으로 할 때 모먼트 3 릴리즈에서는 다음과 같은 작은 변경도 있을 것으로 보인다. 새로운 프린트 화면 바로가기 : PrtScn 키를 누르면 이제 캡처 도구가 열린다. 원드라이브 저장공간 표시 : 윈도우 11 설정 앱 안의 계정 페이지에서 사용자의 모든 원드라이브 구독 내용에 할당된 저장 공간의 전체 양을 확인할 수 있다. 2FA 복사 : '휴대폰과 연결' 앱으로 PC에 스마트폰을 연결하면 다른 서비스에서 받은 2FA 인증 코드가 자동으로 복사된다. 터치 키보드 옵션 : 새로운 설정 시간 및 언어 입력 터치 키보드 설정에서 터치 키보드를 항상 보이게 할지, 아예 없앨지, 하드웨어 키보드를 연결하지 않았을 때만 보이게 할지 선택할 수 있다. 키보드를 떼었다 붙일 수 있는 서피스 프로 같은 노트북에서 특히 유용하다. 초 시계 : 이제 작업 표시줄 시계 앱에서 초 단위의 시간을 알 수 있다. 검색용 빙 챗 AI 바로가기 : 이제 검색창에 작은 빙 챗 아이콘이 나타난다. 기업 계정으로 로그인할 때는 기업 아이콘으로 바뀐다. 콘텐츠 적응형 밝기 제어 : 콘텐츠 종류에 따라 디스플레이를 밝거나 어둡게 할 수 있다. HDR은 아니지만 유사한 기능이다. 모먼트 3 이외의 새로운 윈도우 11 기능들 마이크로소프트는 빌드 행사에서 모먼트 3 이외의 신규 기능도 공개했지만 출시 시기는 아직 알려지지 않았다. 일부는 윈도우 참가자 프로그램 베타 코드에서 보았거나 앞으로 볼 가능성이 있고, 다른 기능은 모먼트 업데이트를 통해 윈도우 PC에 배포될 것이다. WinRAR 지원 : WinRAR, 7Zip, GZ 같은 압축 포맷 형식이 윈도우에 통합된다는 반가운 소식이 전해졌다. 마이크로소프트는 해당 기능을 빠른 시일 내에 테스트할 것이으로 보이며, 완전한 압축 해제 기능이 윈도우 11에 릴리즈되는 것은 9월쯤으로 예상된다. 2024년에는 RAR, Zip 같은 다른 압축 파일을 생성하는 것도 가능하다. 윈도우 코파일럿 : 빌드 행사에서 큰 주목을 받은 윈도우 코파일럿은 AI 기술을 윈도우로 가져온다. 마이크로소프트는 6월 중 윈도우 코파일럿 출시를 약속했지만, 구체적인 방법은 알려지지 않았다. 윈도우 참가자 프로그램에서 윈도우 코파일럿을 확인할 수 있기를 기대한다. 작업표시줄 앱 그룹 해제 : 윈도우 10에서는 작업표시줄 내 다수 앱에 개별 레이블을 지정해 표시할 수 있다. 윈도우 11도 이 기능을 다시 수용했다. 참가자 프로그램(개발자 채널) 릴리즈에서 이번 주에 공개될 예정이다. 머지않아 전체 공개되기를 기대한다. 작업표시줄 앱 우클릭 : 작업표시줄과 관련한 또 하나의 재미있는 기능이 있다. 마치 작업 관리자에서 하듯이 작업표시줄에서 앱을 우클릭해 진행 중인 작업을 종료할 수 있다. 윈도우 백업 : 마이크로소프트는 참가자 프로그램(개발자 채널)에서 윈도우 백업을 테스트하고 있다. 윈도우 백업은 파일, 폴더(데스크톱에서의 레이아웃 위치까지), 앱과 더 많은 데이터를 클라우드에 저장하고 새로운 PC에서 재설치를 지원하는 기능이다. RGB 조명 제어 : 크리스마스트리처럼 색색의 조명을 달고 작동 중일 때마다 반짝거리는 PC 주변장치를 여럿 소유하고 있다면 축배를 들 만한 소식이다. 최근 마이크로소프트는 RGB 조명을 윈도우에서 제어하는 기능을 추가하고 업계에 표준화된 설정을 제공한다고 밝혔다. editor@itworld.co.kr
PC 사용자에게 가장 인기 있는 웹 브라우저인 크롬은 처음에는 빠르고 반응성 좋은 브라우징 경험을 제공하지만, 시간이 지나면 캐시 파일, 확장 프로그램, 리소스 소비 등의 요인 때문에 느려질 수 있다. 크롬의 성능을 향상시키는 방법은 브라우저 최신 상태 유지, 캐시 삭제, 이용 가능한 특수 기능 활용 등 많다. 크롬 실행 속도를 최대한 빠르게 유지하는 간단한 9가지 방법을 소개한다. 크롬을 항상 업데이트할 것 크롬을 최신 버전으로 업데이트하면 가장 최근의 성능 개선과 버그 수정, 보안 업데이트를 확보할 수 있다. 구글은 브라우저에 업데이트를 자주 제공하므로 항상 최신 상태를 유지하는 것이 중요하다. 업데이트는 브라우저를 닫을 때 백그라운드에서 자동으로 실행되도록 설계되어 있으며, 브라우저를 닫는 일이 거의 없다면 업데이트를 직접 확인해야 한다. 크롬은 업데이트 시간이 되면 브라우저 창 우측 상단 구석에 버튼이 생긴다. 이 버튼을 누르면 업데이트된다. 버튼이 보이지 않는다면 창 우측 상단 구석에서 세로 방향 점 3개 도움말 Chrome 정보를 클릭한다. 그러면 크롬이 업데이트를 확인한 후 설치한다. 다시 시작을 클릭하면 크롬 업데이트가 완료되고 크롬이 닫힌다. 따라서 업데이트 전에는 탭에 미완성 작업이 열려 있지 않은 지 확인해야 한다. 너무 많은 탭을 열지 말 것 브라우저에서 탭을 여러 개 열어 놓으면 메모리가 소비되며, 메모리만큼은 아니지만 CPU도 소비된다. 열어 놓은 탭의 개수가 늘어날수록 컴퓨터 리소스에 대한 수요도 늘어난다. 성능이 저하되고 페이지 로드 시간이 늘어날 수 있다. 시스템이 과부하 상태가 되면 정지 또는 멈춤 현상까지 발생할 수 있다. 미사용 확장 프로그램을 설정 해제할 것 확장 프로그램은 브라우저에 기능을 추가하는 작은 소프트웨어 프로그램이다. 유용하지만 너무 많이 설치하거나 부실하게 최적화된 것을 사용하면 구글 크롬의 성능에 부정적인 영향을 미칠 수 있다. 불필요한 확장 프로그램을 설정 해제하면 브라우저의 성능을 높일 수 있다. 브라우저 확장 프로그램을 설정 해제하는 방법은 간단하다. chrome://extensions 로 들어가 해당 확장 프로그램의 슬라이더를 끔 위치로 밀거나 삭제를 클릭하면 된다. 브라우징 데이터를 삭제할 것 기록, 쿠키, 캐시 파일 등의 브라우징 데이터를 삭제하면 디스크 공간이 확보되고 오래되거나 손상된 파일로 야기된 웹사이트 문제가 해결되므로 성능 향상에 도움이 된다. 시스템 성능뿐 아니라 개인정보보호 및 보안도 향상된다. 일반적으로 쿠키와 캐시 파일은 빠른 접근을 위해 컴퓨터의 RAM에 저장되므로 브라우징 데이터를 삭제하면 RAM 사용량을 줄여 성능이 향상될 수도 있다. 특히 장치의 메모리가 한정적인 경우, 브라우징이 부드러워지고 페이지 로딩 시간도 빨라지는 것이 보통이다. 브라우징 데이터를 삭제하는 방법은 세로 방향 점 3개 설정 개인 정보 보호 및 보안을 클릭한 후 각 옵션을 개별적으로 선택하고 데이터를 삭제하면 된다. 웹 페이지 미리 로드를 설정할 것 웹 페이지 미리 로드를 설정하면 웹 페이지에 실제로 도착하기 전에 리소스를 가져와 로드 함으로 성능이 향상된다. 사용자가 링크 위에 커서를 가져가거나 특정 페이지에 방문할 것으로 예측되면 크롬은 해당 페이지를 표시하는 데 필요한 리소스(예 : 이미지, CSS, 자바스크립트 파일)을 가져오기 시작한다. 이 작업은 사용자가 아직 현재 페이지에 있는 동안 배경에서 수행된다. 사용자가 결국 링크를 클릭하는 시점에는 컨텐츠의 많은 부분이 이미 로드 된 상태이므로 페이지의 로드 속도가 더욱 빨라 보인다. 웹 페이지 미리 로드를 설정하는 방법은 세로 방향 점 3개 설정 개인 정보 보호 및 보안 쿠키 및 기타 사이트 데이터를 클릭한 후 빠른 탐색 및 검색을 위해 페이지 미리 로드 옆에 있는 슬라이더를 켬 위치로 밀면 된다. 크롬의 에너지 절약 모드를 사용할 것 크롬의 에너지 절약 모드는 주요 기능이 배터리 지속 시간을 아끼는 것이지만 특정 배경 활동을 제한하는 방식으로 성능도 약간 향상시킨다. 에너지 절약 모드는 배터리 잔량이 20% 이하인 경우에만 사용 설정할 수 있으며, 컴퓨터의 전원이 연결되어 있지 않을 때 사용 설정할 수도 있다. 에너지 절약 모드를 설정하려면 세로 방향 점 3개 설정 성능을 클릭하고 전원 그룹에서 에너지 절약 모드 옆에 있는 슬라이더를 켬 위치로 민 다음 이 기능을 활성화하고자 하는 경우를 선택한다. 하드웨어 가속을 설정할 것 하드웨어 가속을 설정하면 크롬은 하드웨어 가속이 도움이 되는 특정 작업에 컴퓨터의 GPU를 사용한다. GPU는 그래픽 집약적인 작업을 효율적으로 처리하도록 설계되었고 특정 연산을 병렬로 처리할 수 있기 때문에 동영상 재생, 애니메이션, 그래픽 렌더링과 같은 작업에 더욱 적합하다. 이런 작업 중 일부를 CPU에서 GPU로 전가하면 성능이 향상되고 웹 컨텐츠 렌더링이 부드러워지며 시스템 리소스 소비가 줄어든다. 이는 고성능 그래픽 카드가 탑재된 시스템에서나 그래픽 요소가 많은 애플리케이션 및 웹사이트를 사용하는 경우에 특히 유익하다. 하드웨어 가속을 설정하려면 세로 방향 점 3개 설정 시스템을 클릭한 후 가능한 경우 하드웨어 가속 사용 옆에 있는 슬라이더를 켬 위치로 민다. 구글 플래그에서 GPU 래스터화를 설정할 것 래스터화는 벡터 그래픽(예: HTML, CSS, SVG 요소)을 화면에 표시될 수 있는 픽셀로 변환하는 과정이다. 기본적으로 크롬은 래스터화에 CPU를 사용한다. GPU 래스터화를 설정하면 이 작업이 컴퓨터의 GPU로 대신 전가된다. GPU는 CPU보다 그래픽 처리를 더욱 효율적으로 처리하도록 설계되었으므로 특히 고성능 GPU가 탑재된 시스템에서 웹 페이지의 렌더링이 빨라지고 성능이 향상될 수 있다. GPU 래스터화를 설정하는 방법은 chrome://flags로 이동하여 GPU Rasterization(GPU 래스터화)를 검색한 후 항목 옆에서 Enabled(설정)을 선택하면 된다. 이는 실험적인 기능이며 구글 크롬은 이 기능을 테스트 목적으로만 사용함을 분명히 밝히고 있다는 점에 유념해야 한다. 사용할 수 있다고 해서 사용해야 하는 것은 아니다. 위험이 보상보다 클 수도 있다. 또한, 하드웨어 가속을 설정했다면 래스터화도 어차피 설정되어 있다. 구글 크롬 설정을 초기화할 것 크롬을 기본 설정으로 초기화하면 브라우저가 원래 구성으로 복원되고 속도 저하 등의 문제의 원인인 사용자화, 확장 프로그램, 설정이 제거되므로 성능 문제가 해결될 수 있다. 이 방법은 다른 성능 개선 방법을 시도했으나 실패했거나 어떤 구체적인 설정이나 확장 프로그램이 문제의 원인인지 확실하지 않은 경우에 사용하면 좋다. 구글 크롬 설정을 초기화하려면 세로 방향 점 3개 설정 설정 초기화를 클릭하면 나오는 페이지에서 설정을 기본 값으로 복원하는 옵션을 선택하면 된다. 구글은 이미 크롬 속도를 높이고 있다 구글 크롬 112는 이 인기 웹 브라우저의 성능을 상당히 개선했다. innerHTML 파싱을 위한 전문 고속 경로뿐만 아니라 toString() 및 join()와 같은 자바스크립트 함수가 최적화되었다. 이런 기능은 다수의 웹사이트와 웹 앱에 걸쳐 널리 활용되면서 웹 브라우징에 눈에 띄는 차이를 가져왔다. 구글은 이런 개선 덕분에 3개월간 애플의 스피도미터(Speedometer) 2.1 브라우저 벤치마크가 10% 증가했다고 전했다. 크롬을 항상 최신 상태로 유지해야 할 또 하나의 이유다. 구글이 노고를 들여 항상 내놓는 성능 업데이트를 적극 활용하자. editor@itworld.co.kr
‘챗GPT’는 인공지능과 상호작용하는 방식에 혁신을 가져왔다. 고급 자연어 처리 기능을 갖춘 챗GPT는 퀴즈 놀이부터 시 쓰기까지 다양한 작업에 도움을 줄 수 있다. 여기서는 챗GPT를 활용할 수 있는 놀랍도록 재미있고 유용한 10가지 방법을 살펴본다. 재미있는 레시피 만들기 챗GPT가 할 수 있는 흥미로운 일 중 하나는 사용자의 입맛, 재료, 특정 식단 요건에 따라 레시피를 생성하는 것이다. 원하는 요리 종류, 사용하려는 재료, 식이 제한 사항 등 특정 정보를 입력하면 된다. 그러면 챗GPT가 단계별 지침, 재료의 양, 요리 팁이 포함된 레시피를 알려준다. 챗GPT에 위스키를 베이스로 하고 스웨덴 미트볼을 사용한 칵테일을 만들어 달라고 했다. 챗GPT는 파격적인 요청이라는 점을 금방 알아차렸지만 이내 요구사항에 따라 레시피를 제공했다. 칵테일 이름도 ‘스모키 미트볼 즈위즐’이라고 지어줬다(개인적으로는 ‘미트볼 맨해튼’이 더 낫다고 생각한다). 맞춤형 운동 계획 챗GPT는 사용자의 체력 수준, 목표, 사용 가능한 장비, 건강 상태 등에 따라 맞춤화된 운동 계획을 짤 수 있다. 기본 정보, 현재 체력 수준, 운동 경험, 목표, 건강 상태, 장비 사용 가능 여부 등의 정보를 제공하면 된다. 챗GPT에 3개월짜리 운동 계획을 만들어 달라고 했다. 나이, 성별, 몸무게를 입력하고 무릎이 좋지 않다고 언급했다. 또 헬스장 장비를 이용할 수 없고, 7kg가량을 감량하는 것이 목표라고 덧붙였다. 우선 챗GPT는 새로운 운동 계획을 시작하기 전에 의사 또는 개인 트레이너와 상담하고, 부상을 입지 않도록 자세 모니터링이 중요하다고 권고했다. 이어 제공한 정보를 바탕으로 운동 계획을 알려줬다. 어떤 정보를 입력해야 할지 모르겠다면 챗GPT에 가장 정확하고 개인화된 운동 계획을 짜는 데 필요한 정보가 무엇이냐고 물어볼 수도 있다. 퀴즈 게임 다양한 주제에 대한 질문, 답변 또는 흥미로운 사실을 제공해 챗GPT와 퀴즈 게임을 하거나, 퀴즈 게임을 만들어 달라고 할 수 있다. 예를 들어 챗GPT에게 게임하고 싶다고 말한 다음, 주제나 테마를 지정하면 챗GPT가 질문을 던진다. 직접 만든 퀴즈로 챗GPT에 문제를 낼 수도 있다. 챗GPT에게 퀴즈 게임을 하고 싶다고 말한 다음, 양자 물리학에 관련된 5가지 질문을 해달라고 했다. 챗GPT는 답을 입력하면 정답인지 아닌지 알려준다고 말했다. 구글의 도움으로 간신히 5개 퀴즈 중 3개를 맞힐 수 있었다. 가상의 여행 가이드 챗GPT는 다양한 여행지 정보, 추천, 조언을 제공하는 가상의 여행 가이드 역할을 할 수 있다. 한 가지 명심해야 할 점은 챗GPT의 지식은 적어도 현재로서는 2021년까지의 데이터를 기반으로 한다는 것이다. 즉, 신상 레스토랑처럼 최근에 문을 연 곳은 추천할 수 없다. 하지만 방문 장소, 현지 관습, 요리, 기타 여행 관련 주제에 관해 귀중한 인사이트를 얻을 순 있다. 챗GPT에게 대만 타이베이로 여행을 계획 중이라고 하고, 꼭 가봐야 할 명소와 현지인에게 인기 있는 음식을 추천해 달라고 했다. 방문해야 할 장소와 추천 음식 목록은 꽤 정확했지만, 개인적으로는 대만식 오믈렛 단빙이 목록에 포함돼 있지 않아 아쉬웠다. 음악 작곡 챗GPT는 직접 음악을 작곡하거나 오디오 파일을 만들 순 없지만 가사 작성, 코드 진행 제안, 노래 구조 및 편곡 팁 제공 등을 도울 수 있다. 특정 음악 콘셉트 지침을 요청하거나 멜로니 또는 하모니 아이디어를 브레인스토밍할 수도 있다. 챗GPT에게 E플랫 단조로 작곡 중인 재즈에 좋은 코드 진행을 제안해 달라고 했다. 챗GPT는 i – iv – VII7 – III7 – V7 – i(9) 코드 진행을 제안하고, 재즈 곡에 깊이를 더하기 위해 코드 확장, 대체, 변경을 실험해 보라고 권유했다. 명상 및 마음 챙김 연습 명상을 좋아하는 사용자가 있다면 챗GPT가 마음 챙김 운동을 도와줄 수 있다. 예를 들어 5분 동안 마음 챙김 호흡 운동을 하고 싶다고 하면, 챗GPT가 어떻게 해야 하는지 단계별로 자세히 알려준다. 다른 유형의 명상이나 마음 챙김 운동을 하고 싶지만 어떻게 해야 할지 잘 모르겠다면 언제든지 챗GPT에게 제안을 요청할 수도 있다. 이력서 작성하기 시중에 많은 이력서 빌더가 있지만, 이력서를 직접 작성하려고 한다면 챗GPT가 콘텐츠 및 형식 지침, 제안, 팁을 제공할 수 있다. 이력서에 포함하려는 업무 경험, 교육, 스킬, 성과, 기타 세부 정보를 입력하면 된다. 챗GPT로 이력서를 작성하는 것이 다소 불편하다면, 지원 직무에 관한 이력서 템플릿을 제공해 달라고 요청할 수도 있다. 실제로 PC월드에서 기자로 일하고 싶지만 개인정보는 제공하고 싶지 않다고 말했더니 꽤 괜찮은 이력서 템플릿을 만들어줬다. 빈칸을 채우기만 하면 됐다. 개인 스타일리스트 AI가 실제로 사람을 스타일링할 수 있는 수준까지 발전하진 못했지만, 의상 아이디어, 색 조합, 액세서리 등을 제안할 순 있다. 아울러 특정 상황에 맞는 옷차림 팁을 제공할 수도 있다. 선호하는 스타일, 체형, 행사 내용, 기타 특정 요구사항 등 몇 가지 개인 정보를 공유해야 한다. 이를테면 닌텐도를 테마로 한 파티에 갈 예정인데, 닌텐도의 기업 컬러를 반영한 비즈니스 캐주얼 스타일 제안이 필요하다고 챗GPT에 말했다. 매우 상세한 제안을 받았다. 텍스트 기반 RPG 게임 챗GPT는 주어진 프롬프트에 응답하고 시나리오에 따라 선택하며 플레이하는 텍스트 기반 롤플레잉 게임을 만들 수 있다. 게임 설정을 챗GPT에 맡기거나, 직접 자세한 설명을 할 수 있다. 예를 들면 방금 불시착한 외딴 적대 행성을 배경으로 하는 텍스트 기반 롤플레잉 게임을 하고 싶다고 챗GPT에 말했다. 이어 플레이어는 탑승자 중 유일하게 살아남은 사람이고, 이 행성에는 초목과 물이 거의 없으며, 목표는 살아남아 원래 행성으로 돌아가는 것이라고 덧붙였다. 시 쓰기 챗GPT는 다양한 스타일과 테마로 시를 쓸 수 있다. 주제, 스타일, 원하는 분위기 등 시를 작성하는 데 필요한 기본 정보나 관련 있는 정보를 챗GPT에 알려주면 된다. 그러면 해당 정보를 바탕으로 시를 생성한다. 마리오가 젤다를 가논도르프에서 구출하고 피치 공주가 질투를 느껴 루이지와 함께 도망치는 장면에 관한 시를 써달라고 요청했다. 아울러 자유시의 아버지라고 불리는 월트 휘트먼 스타일로 써야 한다고 덧붙였다. 그 결과 환상적인 시가 탄생했고, 이를 다시 하이쿠(일본 정형시)로 바꿔달라고 말했다. 다음 단계는? 챗GPT는 어시스턴트, 엔터테인먼트 또는 창의적인 영감을 원하는 사용자에게 ‘가능성의 세계’를 열어줬다. 레시피와 운동 계획 생성부터 이력서 작성, 시 창작까지 다양한 작업을 처리할 수 있는 다재다능함은 일상을 증강하는 AI의 힘을 보여준다. 기술이 계속 발전하면서 챗GPT와 유사한 AI 모델은 더욱 혁신적으로 응용되리라 예상된다. AI 어시스턴트의 미래는 밝으며, 사람들이 디지털 세상과 상호작용하는 방식을 혁신할 잠재력은 이제 겨우 표면을 드러내기 시작했을 뿐이다. editor@itworld.co.kr
여러 대의 컴퓨터 모니터로 작업하는 데 익숙하다면 노트북만 가지고 출장을 떠나는 것이 힘들 수 있다. 비좁은 노트북 디스플레이 하나만 써야 하기 때문이다. 하지만 다행히도 오래된 아이패드나 안드로이드 태블릿 또는 기타 노트북을 윈도우 PC용 추가 모니터로 활용할 방법이 있다. 심지어 공짜다! 바로 ‘스페이스데스크(Spacedesk)’ 앱을 사용하는 것이다. 물론 유일한 멀티 모니터 소프트웨어는 아니지만 지금까지 본 무료 옵션 가운데 가장 다재다능하다. 윈도우용 스페이스데스크 설치 스페이스데스크는 2가지 부분으로 구성된다. • 스페이스데스크의 드라이버 소프트웨어는 PC의 백그라운드에서 실행돼 다른 화면과 연결된다. 스페이스데스크 웹사이트에서 다운로드해 설치할 수 있다. 스페이스데스크를 실행하려면 방화벽 예외 설정을 해야 한다. 이 옵션은 설치 과정에 포함돼 있다. • 다른 기기에서 스페이스데스크의 뷰어 앱을 실행하면, PC에서 해당 기기를 보조 모니터로 인식한다. 웹 뷰어를 통해 윈도우, iOS, 안드로이드, 아마존 기기 및 기타 모든 기기에서 앱을 사용할 수 있다. 서버 연결은 와이파이를 통해 이뤄진다. 드라이버 소프트웨어를 설치했다면 뷰어 앱을 연다. 예를 들어 PC와 태블릿이 동일한 와이파이 네트워크에 연결돼 있으면 스페이스데스크가 자동으로 태블릿을 감지한다. 태블릿을 선택하고 2번째 화면 모드를 시작할 수 있다. 스페이스데스크 구성 기본적으로 스페이스데스크는 디스플레이 UI를 확대하지 않기 때문에 보조 모니터에서 너무 작게 보일 수 있다. 이 문제를 해결하려면 ‘윈도우 설정 시스템 디스플레이’로 이동해 모니터 목록에서 새 디스플레이를 선택한 다음, 디스플레이 해상도와 배율을 조정하면 된다. 아울러 스페이스데스크 드라이버는 컴퓨터가 부팅될 때마다 항상 실행된다. 변경하고 싶다면 스페이스데스크의 작업 표시줄 아이콘을 마우스 오른쪽 버튼으로 클릭하고, ‘스페이스데스크 드라이버 콘솔’을 선택한 다음 ‘시스템 부팅 시 자동 시작’을 해제한다. 윈도우에서도 모니터를 구성해야 한다. ‘설정 시스템 디스플레이’로 들어가면 모든 화면의 레이아웃이 표시되며, 이를 드래그 앤 드롭해 실제 위치를 반영할 수 있다. 뷰어 앱에서 톱니바퀴 아이콘을 클릭하고 추가 옵션(예: 화면 해상도 및 품질 등)을 설정할 수도 있다. 안타깝게도 스페이스데스크는 안드로이드 기기에서 유선 USB 연결만 지원한다. 아울러 향후 유선 연결 기능이 프리미엄 기능이 될 수 있다고 밝힌 바 있다. 그렇지만 무선 연결 상태에서 스페이스데스크는 이메일을 보내고, 문서를 확인하며, 팀 채팅을 하기에 충분한 성능을 갖췄다. 시스템 오디오와 동기화해 비디오를 재생하는 데도 문제가 없었다. 기타 멀티 모니터 소프트웨어 옵션 스페이스데스크 외에 살펴볼 만한 앱은 다음과 같다. • 루나 디스플레이(Luna Display)는 아이패드나 남는 맥을 보조 모니터로 바꾸는 130달러짜리 동글이다(USBC, HDMI 또는 맥용 디스플레이포트에서 사용 가능). 일반적으로 다른 솔루션에서 흔하게 볼 수 있는 커서 지연 문제가 없다. 그래픽 디자인 또는 세밀한 입력이 중요한 기타 애플리케이션에서 매력적인 대안이다. • 듀엣 디스플레이(Duet Display)는 유선 및 무선 연결을 모두 지원한다. 하지만 연간 25달러의 유료 서비스다. • 삼성 갤럭시 탭 사용자는 삼성의 세컨드 스크린(Second Screen) 앱을 활용해 태블릿을 보조 모니터로 사용할 수 있다. • 맥 사용자는 사이드카(Sidecar) 기능을 통해 아이패드를 보조 모니터로 활용할 수 있다. 제어 센터에서 ‘디스플레이’ 버튼을 누른 다음, 아이패드를 선택해 활성화하면 된다. 또는 녹색 전체 화면 버튼 위에 커서를 놓고 아이패드로 이동하는 옵션도 있다. editor@itworld.co.kr
최신 업데이트 버전인 iOS 17.4의 가장 큰 변화는 유럽연합 디지털시장법에 대비해 사용자의 서드파티 앱 스토어를 허용한 것이었다. 애플이라는 정원을 둘러싼 울타리 한 귀퉁이에 틈이 생긴 것이다. 디지털시장법에서 애플, 구글, 페이스북, 마이크로소프트, 아마존 등 거대 플랫폼 업체는 사용자간 소통을 통제하는 진입 장벽 앞 문지기로 정의되고 적극 규제 대상이 되었다. 디지털 서비스 없이는 아무것도 할 수 없는 세상에서 거대 기업을 적극 규제해 독과점을 방지하는 디지털시장법은 정보 편향 제거, 미성년 대상 광고 축소 등 실질적인 변화를 이끌어내고 있다.
생성형 AI 열풍 1년. 아직도 열기는 식지 않았지만 영리를 추구하는 기업은 조금 더 냉정해질 필요가 있다. 생성형 AI의 ROI에 대한 의문이 제기되고 비즈니스 케이스가 먼저라고 조언하는 전문가도 적지 않기 때문이다. 하지만 이런 의문 속에서 이미 생성형 AI를 도입해 성과를 올린 기업이 속속 등장하고 있다. 생성형 AI 업체 역시 자사 고객의 성공 사례를 자랑하고 있으며, 리서치 회사와 컨설팅 회사도 검증을 거친 산업별 사용례를 발표하고 있다.
증강현실, 가상현실 같은 용어에 익숙해졌더니 이제 애플 비전 프로는 공간 컴퓨팅이라는 새로운 개념을 들고 나왔다. 노트북, 태블릿, 스마트폰 등 디스플레이 뒤에서 연산을 실행하는 전통 컴퓨팅과 달리, 공간 컴퓨팅은 사용자 주변의 현실과 가상 공간에서 일어나는 상호작용, 그리고 현실과 가상 세계의 교차점을 의미한다. 애플이 비전 프로의파급력을 높이기 위해 친숙한 단어를 피한 것은 사실이지만, 관련 기술과 제품이 계속 발전한다면 공간 컴퓨팅은 분명 기계와 인간의 새로운 상호작용 방식이 될 것이다. 애플 비전 프로는 이제 시작에 불과하다.
마이크로소프트의 실적을 보면, 오픈AI에 막대한 자금을 투자한 것은 좋은 판단이었다. AI는 성장세가 둔화된 클라우드를 견인하고, 클라우드는 그런 AI의 기업 확산에 첨병 역할을 하고 있다. 하지만 클라우드와 AI의 동행이 행복하기만 한 것은 아니다. 대형 클라우드가 성취한 AI 혁신을 손쉽게 이용할 수 있는 것은 분명 큰 장점이지만, 사용량에 따라 빠르게 증가하는 비용과 민감한 데이터에 대한 불안감, AI 종속 등의 우려사항도 적지 않다. 일부 전문가는 아키텍처에 대한 재검토까지 요구하며 클라우드 기반 생성형 AI에 신중하게 접근할 것을 권고한다.
스팀 덱이 독주하던 핸드헬드 게이밍 PC 시장이 활기를 띠고 있다. 지난해 에이수스와 레노버가 각각 로그 엘라이, 리전 고를 출시한 데 이어 올해는 MSI가 자사 첫 핸드헬드 게이밍 PC ‘클로’를 공개했다. 클로는 인텔 코어 울트라 프로세서에 기반한 첫 핸드헬드 게이밍 PC라는 점에서 게이머의 기대를 한몸에 받고 있다. 정식 출시 전임에도 불구하고 후속작까지 예고됐다. 한편 벨브는 OLED 버전의 스팀 덱을 새롭게 출시하면서 선두 유지에 전념하고 있다. 마침내 핸드헬스 게이밍 PC의 전성시대가 도래하는 것일까? 리뷰부터 활용 기사까지 다양한 관련 소식을 모았다.
사용자에게는 눈이 즐거운 화려함과 기대를 주고, 기술업체에는 연초부터 기선을 제압하고 이미지를 쇄신할 기회인 세계 최대의 기술 박람회인 CES 2024가 개최됐다. 연내에 출시되는 제품도 있지만, 상용화를 염두에 두지 않고도 얼마든지 상상력과 가능성을 펼쳐보일 수 있는 장소다. PC 속 작은 LED 램프부터 반려동물처럼 사용자를 졸졸 따라다니는 가정용 로봇과 가장 실용적인 전자제품인 노트북까지, CES 2024에서 새로운 기술이 구현된 방법을 살펴 보자.
2023년 전체를 관통한 가장 뜨거운 주제를 꼽는다면 고민할 필요도 없이 '생성형 AI'다. 오픈AI가 챗GPT 서비스를 시작한 것이 지난 2022년 11월 30일인데, 불과 1달 후인 2023년 1월 ITWorld 웹사이트에서 가장 많이 본 기사가 <“나는 누구인가?” 챗GPT가 말하는 챗GPT>였다. 이후 2월, 4월, 7월, 9월, 11월까지 생성형 AI 관련 콘텐츠가 월간 많이 본 기사 1위에 올랐다. 흥미로운 것은 내용이 점점 심화, 확장됐다는 사실이다. 초반에는 챗GPT에 대한 호기심이었다면, 상반기에는 개인적인 사용법, 실제 기업의 활용 사례로 관심이 이동했다. 하반기에는 머신러닝 알고리즘, 대규모 언어 모델 같은 더 근본적인 기술에 대한 콘텐츠가 주목받았다. 학습하는 것은 본래 AI가 아니라 인간의 특기다. 2023년 생성형 AI에 대한 기본, 심화 학습을 끝낸 많은 기업과 개발자가 2024년에 어떤 새로운 개념과 서비스를 내놓을까.
아마존까지 생성형 AI 인프라 경쟁에 뛰어들었다. 아마존은 리인벤트 2024 행사에서 구축 서비스의 파운데이션 모델 업데이트, 모델 학습과 앱 개발 속도 향상에 생성형 AI를 활용하는 방법을 제안했다. 이번 행사의 주인공은 마이크로소프트 코파일럿과 직접 경쟁할 기업용 챗봇 아마존 Q였다. LLM 인프라, LLM, 애플리케이션 계층으로 세분화된 AWS의 생성형 AI 전략은 "기업용 생성형 AI에 진심"이라는 평과 함께 그 어느 리인벤트 행사보다 긍정적인 반응을 얻고 있다. 전반적으로 미래가 아닌 지금 바로 사용할 수 있는 다양한 서비스와 기능에 집중한 것도 좋은 변화다.
클라우드에서도 생성형 AI 열풍이 거세다. 빅3 클라우드 모두 새로운 매출원으로 생성형 AI를 내세우면서 그렇지 않아도 계속 증가하는 기업의 클라우드 관련 지출이 점점 더 커지고 있다. 문제는 클라우드가 예전처럼 마냥 저렴하지 않다는 것. IT 하드웨어 비용이 저렴해지면서 온프레미스로 애플리케이션과 데이터를 ‘송환’하는 일이 심심치 않게 벌어지고 있다. 그렇다고 클라우드를 사용하지 않을 수는 없다. ‘클라우드 스마트’ 전략이 필요한 시점, 전문가들은 적절한 통제와 올바른 핀옵스 프로그램, 그리고 적극적인 비용 최적화를 해법으로 제시한다.
PC 경험을 완성하는 것은 다채로운 색상을 사실적으로 재현하고 무한한 스크롤을 부드럽게 유영하는 느낌을 선사하는 모니터도, 어떤 작업이든 닥치는 대로 처리하는 고성능 그래픽카드도, AI를 통해 생산성을 몰라보게 개선하는 OS도 아니다. 사용자와 물리적인 상호작용이 가장 많은, 미세한 피드백까지 손끝으로 느낄 수 있는 키보드다. 자신에게 잘 맞는 키보드를 선택하면 일을 하든 게임을 하든 손의 피로도를 줄일 수 있을 뿐 아니라 눈과 귀도 즐겁다. 인체공학 키보드부터 다양한 기계식 키보드까지 완벽한 PC 경험을 선사할 리뷰 기사를 모았다.
최신 아수스 젠북 듀오 2024년형은 화면이 2개 달려 있어 콘텐츠 제작에 이상적이다. 추가 화면 덕분에 풀사이즈 키보드를 사용하면서 작업 공간을 확장할 수 있다. 제품 컨셉만 보면 레노버 요가 북 9i와 비슷하지만 더 크고 강력하다. MIL-STD-810H 내구성 테스트를 통과했으므로 일상 생활에서 다소 거칠게 사용해도 충분히 견딘다. 무엇보다 다른 고성능 투인원 제품과 비교해도 무겁지 않다. 개인적으로는 디자인이 너무 각진 것이 아쉽지만 전반적으로는 꽤 괜찮은 제품이다. 주요 사양 제품명 : 에이수스 젠북 듀오 UX8406MA-PURE19 테스트 시기 : 2024년 3월 제조사 : 에이수스 프로세서 : 인텔 코어 울트라 7 155H, 인텔 코어 울트라 7 155H, 6pcs P코어 최대 4,8GHz + 8pcs E코어, 2pcs LP코어 그래픽 : 인텔 아크 그래픽 메모리 : 32GB lpddr5x 스토리지 : 1TB SSD 디스플레이 : 2pcs 14인치 광택 OLED, 2880×1800픽셀, 120Hz, 멀티터치 지원 웹캠 : 1080p, 윈도우 헬로용 IR 연결성 : 2pcs 썬더볼트 4, USB-A 3 gen 2, HDMI, 헤드셋 무선 : Wi-Fi 6e, 블루투스 5.3 운영체제 : 윈도우 11 홈 기타 : 폴더블 태블릿 모드, 받침대, 백라이트 지원하는 블루투스 키보드, 스타일러스, 휴대용 가방 포함 소음 수준 : 0-38 dBa 배터리 사용시간 : 1시간 15분 (높은 부하, 최고 밝기, 듀얼 스크린, 120Hz), 15시간 20분 (낮은 부하, 낮은 밝기, 단일 화면만 사용, 60 Hz) 크기 : 31.4×21.8×2cm 무게 : 1.65kg 가격 : 1,499.99달러 주요 성능 벤치마크 결과 시네벤치 R23, CPU 멀티 코어 : 13,699포인트 시네벤치 R23, CPU 싱글 코어 : 1,798포인트 긱벤치 6, CPU 멀티 코어 : 12,586포인트 긱벤치 6, CPU 싱글 코어 : 2,402포인트 긱벤치 6, GPU: 32,129포인트 디스크 읽기 속도 : 최대 4,950.72MB/s 디스크 쓰기 속도 : 최대 3,361.41MB/s 하루 종일 사용할 수 있는 노트북 에이수스 젠북 듀오는 대용량 배터리가 내장돼 있어 업무 중 혼합 사용 시 8~12시간, 배터리 부족 시 최대 15시간까지 안정적으로 사용할 수 있다. 물론 비디오 렌더링과 3D 모델링과 같은 무거운 작업은 배터리를 더 빨리 소모한다. 필자가 그동안 본 것 중 가장 작고 가벼운 65W 어댑터를 기본 제공한다는 것도 장점이다. 키보드는 풀사이즈이며 키보드와 마우스 패드 공간으로 나뉜다. 키보드는 다른 제품 대비 높이가 절반 밖에 안되고 화면을 일종의 패드처럼 쓸 수 있다. 키보드를 끼워 둔 채 노트북 상판을 닫으면 더 두껍고 무거워진다. 키보드는 장점이 많다. 모든 것이 작업하고 사용하기에 고급 노트북과 같은 느낌을 준다. 노트북치고는 잘 만들어진 키에 트래블이 충분하고 백라이트도 켤 수 있다. 유일한 아쉬운 점은 지문 인식기가 없다는 것이다. 하지만 1080p 웹캠 옆에 있는 별도의 카메라인 IR 지원 얼굴 인식 기능을 이용해 안전하게 로그인할 수 있다. 젠북 듀오에는 인텔의 새로운 코어 울트라 프로세서인 코어 울트라 7 155H가 탑재되어 있다. 덕분에 내장된 NPU와 웹캠의 품질과 기능을 향상시키는 새로운 AI 기능, 자동 배경 흐림, 아이 컨택 필터, 얼굴의 동적 프레이밍 기능 등을 사용할 수 있다. 마이크에서 스마트 노이즈 캔슬링 기능도 지원한다. 대부분 작업에 충분한 CPU CPU는 이전 세대 인텔 프로세서보다 성능이 눈에 띄게 향상됐다. 많은 프로그램에서 충분한 컴퓨팅 성능을 제공하고 간단한 게임도 플레이할 수 있는 통합 아크 그래픽 덕분이다. 물론 두 화면 중 한 쪽을 1080p 모드로 설정하고 높은 프레임 속도를 강제하면 상황이 달라진다. 하지만 기본적으로 이 제품의 목적은 유연성과 생산성, 창의성 작업이다. 이를 위해 컴퓨터를 다양한 형태로 거치할 수 있도록 지원한다. 접은 책처럼 옆으로 눕혀서 사용하거나, 테이블 위에 평평하게 놓고 함께 제공되는 액티브 스타일러스로 작업하거나, 두 개의 화면을 세로로 나란히 배치하고 키보드를 앞에 놓은 채 쓸 수도 있다. 유일하게 빠진 것이 360도 플립 스크린이다. 즉, 완전히 뒤집어 사용하는 것은 불가능하다. 이 제품은 빠른 성능에도 불구하고 지나치게 뜨거워지지 않는다. 냉각 기능 덕분이다. '마이 에이수스' 제어 소프트웨어에서 성능 모드를 활성화하면 팬이 가장 큰 소리로 작동하는데, 상당한 수준의 소음이 난다. 심지어 팬이 정지된 상태에서도 완전히 조용한 것은 아니다. 윙윙거리고 딸깍거리는 소리가 뚜렷하기 때문에 민감한 사용자는 짜증스러울 수 있다. 부드러운 필기 경험 펜의 그립감이 편안하고 압력 감도와 기울기 조절이 잘 되어 있어 적절한 드로잉 프로그램을 활용하면 전문가처럼 사용할 수 있다. 또한 다양한 펜 팁을 선택할 수 있어 원하는 필기감을 고를 수 있다. 펜은 블루투스와 페어링하기 전에 USB-C를 통해 충전해야 한다. 키보드는 거치된 상태에서 충전되지만 펜은 아니다. 젠북 듀오는 최고 품질의 화면, 1800p 해상도, 풀 OLED 명암비와 다이내믹스, SRGB 모드를 갖춰, 모든 종류의 미디어 제작에 안성맞춤이다. 젠북 듀오 듀얼 스크린에서 영상을 편집하는 작업해 보면 이 제품이 얼마나 매력적인지 바로 알 수 있다. 단 이를 누리려면 넉넉한 은행 잔고가 필요하다. 이 제품의 가격은 1,499.99달러로, 저렴한 가격이 아니다. 하지만 가벼운 노트북이 필요치 않은 야심 찬 크리에이터라면 충분히 투자할 만한 합리적인 가격이다. 에이수스에서 직접 구매하면 백팩을 함께 제공합니다. 간단한 휴대용 케이스는 기본 제품 구성에 포함돼 있다. 펜을 컴퓨터에 부착할 방법이 없어 분실할 위험이 있는데, 펜을 보관할 수 있는 별도 액세서리도 함께 제공한다. editor@itworld.co.kr
가민 포러너 165(Garmin Forerunner 165)는 가민의 새로운 멀티스포츠 시계다. 가민이 제품군 전반에 걸쳐 다양성을 확대한 덕분에 이제 AMOLED 터치스크린 디스플레이가 탑재된 포러너를 39만 9,000원이라는 비교적 저렴한 가격에 구입할 수 있다. AMOLED 패널이 없는 20만 원대의 보급형 포러너 55 및 40만 원대인 255 사이에 위치한 165는 가민의 기존 중급 시계 옵션에 AMOLED를 추가한 제품이며, AMOLED 패널을 탑재한 고가의 포러너 265보다 훨씬 저렴하다. 다른 경쟁 제품으로는 코로스 페이스 3(Coros Pace 3)과 폴라 페이서(Polar Pacer)가 있다. 가민은 포러너 265 및 965보다 훨씬 저렴한 가격에 AMOLED 러닝 시계를 원하는 러너를 위해 또 다른 가격대를 마련했다. 디자인 및 만듦새 무게 39g 43mm 뮤직 에디션 옵션 제공 포러너 165의 디자인은 최근 유색 화면이 적용된 다른 포러너와 매우 유사하다. 음악을 지원하지 않는 기본 버전은 블랙/슬레이트 그레이 또는 미스트 그레이/화이트스톤 2가지로 제공되며, 뮤직 에디션은 여기에 터코이즈/아쿠아와 베리/라일락 2가지 색상이 추가된다. 두 버전 모두 케이스 크기가 43mm로, 포러너 265보다 작고 포러너 265s와 (42mm) 보다는 약간 크다. 폴리머 베젤과 대부분 가민 포러너에서 볼 수 있는 일반적인 5개의 물리 버튼 배열이 있으며, 모서리에는 더 크고 평평한 운동 버튼이 있다. 제품은 신축성이 좋은 20mm 실리콘 스트랩과 함께 제공된다. 가민의 퀵 릴리즈 메커니즘을 사용해 스트랩을 분리해 다른 스트랩으로 교체할 수 있다. 컬러 화면이 시선을 사로잡는다. 1.2인치, 390×390 해상도의 터치스크린으로, 비보액티브 5과 화면 크기와 화질이 비슷하다. 선명하고 컬러풀한 화면에 반응성이 뛰어나며, 밝기는 조절할 수 있다. AOD(Always On Display) 기능을 통해 모든 상황에서 화면을 계속 켜둘지 제어할 수 있다. 운동할 때만 켜고 트래킹 중중간에는 끄는 것도 가능하다. 포러너 165는 매우 세련되고 가벼운 시계로, 하루 종일 착용하기 적합하고 뛰어난 품질의 AMOLED 디스플레이를 갖추고 있다. 다만 조금 더 큰 시계를 선호한다면 이 제품이 적합하지 않다. 포러너 165에 비용을 조금만 더 추가하면 음악 플레이어가 포함된 버전을 살 수 있는데, 이런 경우 비보액티브 5보다 가격이 3만원 더 비싸진다. 건강 및 피트니스 트래킹 달리기와 수영 트래킹 성능이 좋음 견고한 심박수 추적 성능 새로운 가민 수면 코치 및 철인3종 추적 기능 없음 다른 포러너와 마찬가지로 달리기 트래킹이 우선이며, 오픈 워터 수영 모드처럼 달리기와 사이클링 및 수영에 특화된 트래킹 모드를 제공한다. 계단 오르기, 요가, 실내 사이클링과 같은 실내 활동을 위한 추가 트래킹 모드도 있으며, 하이킹과 같은 야외 활동을 위해 제작됐다. 하지만 여러 종목을 추적하는 기능은 없어 철인 3종에는 적합하지 않다. 이 제품을 구매하는 이유가 달리기라면 포러너 165는 좋은 성능을 발휘할 것이다. 페이스 전략을 설정하는 페이스프로(PacePro)와 같은 유용한 트레이닝 기능에 액세스하고 가민 코치(Garmin Coach)에 액세스해 달리기 훈련 계획을 세울 수 있다. GPS가 내장되어 있지만, 다른 신형 포러너와 달리 높은 건물 근처나 숲이 우거진 지역에서 시계를 사용할 때 추적 정확도를 높여주는 멀티 밴드 GNSS 시스템은 지원하지 않는다. 멀티 밴드 GNSS 기능이 있는 포러너 965와 코로스 페이스 3과 포러너 165를 비교했는데, 거리 추적 정확도는 일반적으로 965와 페이스 3보다 부족했지만, 걱정할 수준까지는 아니었다. 최고의 GPS 정확도가 필요하다면 포러너 165가 적합하지 않지만, 다른 기능 대부분은 성능이 견고하다. 165에는 심박수와 혈중 산소 포화도를 추적하는 가민의 구형 엘리베이트 4(Elevate Gen 4) 광학 센서가 탑재됐는데, 고강도 트랙 운동에서 잘 작동했다. 폼 팩터가 작은 것이 도움이 되는 것 같다. 언제나 최고의 정확도를 원한다면 외부 심박수 모니터와 페어링할 수 있다. 필자는 폴라 H10(Polar H10) 가슴 스트랩 모니터와 페어링했고 문제 없이 사용했다. 길을 잃었을 때 유용하게 사용할 수 있는 이동 경로 탐색 기능도 지원한다. 포러너 165는 달리기 이외의 운동에서도 매우 유능하다. 필자는 수영장에서의 수영, 실내 자전거 라이딩 추적에 사용했다. 조정과 같은 일부 실내 운동은 지원하지 않아서 아쉬웠다. 훈련 인사이트를 보면, 가민 포러너 제품군에서 제공하는 모든 기능을 제공하지는 않는다. 권장 회복 시간, 신체 배터리 에너지 모니터와 같은 단순화된 인사이트를 얻을 수 있으며, 회복에 필요한 사항을 안내하는 심박수 변동성 측정 기능인 HRV 상태 분석도 제공한다. 다만 훈련 준비 상태 지표를 간소화해서라도 제공하지 않는 점이 아쉬웠다. 다른 가민 시계와 마찬가지로 포러너 165는 피트니스 트래커로도 작동한다. 일일 걸음 수를 계산하고 진행 상황에 따라 자동으로 목표를 조정하며, 심박수를 지속적으로 모니터링한다. 이런 작업을 매우 안정적으로 수행한다. 이 밖에 수면과 낮잠을 추적해 수면 점수를 생성하고, 수면 시간을 추적해 수면 통계를 낸다. 하지만 가민의 새로운 기능인 수면 코치 기능은 지원하지 않는다. 정확도 측면에서 가민의 수면 추적 기능이 개선된 듯했다. 포러너 165의 수면 시간 및 수면 단계 분석과 수면 심박수가 오로라 링 3세대(Oura Ring Gen 3)와 비슷한 수치를 기록했다. 스마트워치 기능 안드로이드 및 아이폰 알림 보기 지원 뮤직 에디션 음악 저장 공간 4G 커넥트 IQ와 호환 포러너 165는 스마트워치로서의 성능이 매우 뛰어나다. 가장 큰 이유는 AMOLED 터치스크린 디스플레이 덕분이다. 메뉴 화면 스크롤, 긴 알림 읽기, 음악 듣기와 같은 기능을 훨씬 더 편리하고 쾌적하게 사용할 수 있다. 필자가 테스트한 뮤직 에디션은 4GB의 저장 공간을 제공하며, 와이파이를 지원해 스포티파이, 디저(Deezer) 및 아마존 뮤직과 같은 스트리밍 서비스의 오디오를 저장할 수 있다. 선호하는 앱을 다운로드하면 음악을 쉽게 동기화할 수 있으며, 시계와 헤드폰 간의 연결이 대체로 원활해 다양한 블루투스 헤드폰과 페어링하는 데 문제가 없었다. 배터리 수명 및 충전 일상적인 사용 시 최대 11일 GPS 사용 시 최대 19시간 음악 스트리밍 시 최대 7시간 가민 165의 배터리 성능은 뛰어나다. 가민은 스마트워치 모드에서 최대 11일 동안 사용할 수 있다고 주장하지만, 이는 AOD를 비활성화한 경우에서다. AOD를 켜면 배터리 수치가 비교적 빠르게 떨어진다. 혈중 산소 포화도 추적과 음악 스트리밍도 배터리를 빠르게 소모하는 대표적인 기능이다. 일반 GPS 추적 및 알림을 활성화하고 음악 스트리밍과 기타 스마트워치 기능을 함께 사용했을 때 일일 배터리 소모량은 약 20%로, 약 4~5일 정도 지속하는 것으로 나타났다. 이보다 더 오래 사용하려면 매일 사용하는 기능에 세심한 주의를 기울여야 한다. AOD 모드를 사용하면서 운동 기록까지 추적하면 배터리는 2~3일 정도 지속한다. GPS를 켜고 외부에서 1시간 동안 달렸을 때는 배터리가 8% 감소했다. 3시간 동안 달리니 20% 더 줄었다. GPS 추적 중에 AOD 모드를 활성화하면 30분간 7%의 배터리가 감소한다. 포러너 165 충전 케이블은 가민이 거의 모든 제품군에 사용하는 것과 동일하다. 가민의 다른 AMOLED 시계와 마찬가지로 AMOLED가 아닌 시계보다 충전 속도가 더 빠른 것으로 보인다. 가격 2024년 2월 20일 출시된 가민 포러너 165의 출시 가격은 음악 재생을 할 수 없는 일반 모델이 39만 9,000원이며, 와이파이를 지원하는 뮤직 에디션은 45만 9,000원이다. 가민 공식 홈페이지에서 구매할 수 있다. 포러너 165의 가격은 코로스 페이스 3(33만 9,000원)과 폴라 페이서(35만 원)와 같은 다른 중저가 시계보다 조금 비싼 편이다. 가민의 다른 제품군과 비교할 때 일반 모델은 비보액티브 5(42만 9,000원)보다 약간 저렴하며, 뮤직 에디션은 이보다 약간 비싸다. 가민 포러너 165, 구매해야 할까? 가민 포러너 165는 이미 광범위한 가민의 멀티스포츠 시계 컬렉션에 추가된 또 하나의 눈에 띄는 제품이다. 상대적으로 높은 가격대인 가민 포러너 200 시리즈를 보완하며, 더 저렴한 가격으로 AMOLED가 탑재된 포러너를 사용할 수 있는 방법이다. 비슷한 가격대의 코로스 페이스 3 및 폴라 페이서와 비교할 때는 스마트워치와 스포츠워치의 조합 측면에서 포러너 165가 우수하지만, 달리기 추적 기능만 보면 페이스 3이 여러 면에서 우수하고 듀얼 밴드 GPS도 지원한다는 점을 참고하라. 표준형 포러너 165보다 3만 원 더 비싼 비보액티브 5는 음악 플레이어를 기본으로 제공하고 알루미늄 베젤, 추가 건강 및 웰니스 모니터링 기능, 고급 인터벌 트레이닝 지원과 함께 전반적으로 유사한 기능을 제공한다는 점도 고려할 만하다. 비보액티브 5는 골프 전용 모드도 제공한다. 결론적으로 포러너 165는 전반적으로 좋은 경험을 제공하지만, 중간 가격대의 가민 컬렉션에서는 포지셔닝이 애매한 편이다. 세부 사양 1.2인치 390×390p AMOLED 디스플레이 폴리머 케이스 4GB RAM 5 ATM 방수 등급 20mm 퀵 릴리스 스트랩 43×43×11.6mm 39g editor@itworld.co.kr
낫싱(Nothing)은 2020년 설립된 이제 겨우 4년된 기업이지만, 상당한 관심을 받고 있다. 그동안 몇 가지 이어버드도 만들었는데, 가장 주목 받는 것은 역시 스마트폰이다. 오리지널 낫싱 폰 (1)은 엄청난 반향이 있었고, 이어진 낫싱 폰 (2)는 전작의 소소한 업그레이드였다. 가장 최근에 나온 낫싱의 3번째 스마트폰 '낫싱 폰 (2a)'은 컨셉이 조금 다르다. 이전 두 제품보다 훨씬 저렴하다. 낫싱은 이 제품이 엄밀히 말해 낫싱 폰 (1)의 후속 제품이라고 설명했다. 업체 홍보 자료를 보면, 이 제품은 낫싱 폰 (1)보다 사양을 높이면서도 가격은 오히려 낮췄다. 이 제품은 350유로 이하 가격대에서 최고의 스마트폰으로 꼽을 만할까? 낫싱 폰 (2a)를 메인 폰으로 몇 주간 써 본 결과를 정리했다. 디자인과 기능 반투명 후면 3개의 LED 글리프 라이트 편안하지만 미끄러운 디자인 낫싱 폰 (2a)는 시선을 사로잡는 디자인이다. 낫싱 폰 (1)과 낫싱 폰 (2)와 마찬가지로 후면이 반투명이고, 휴대폰 내부를 전부는 아니고 일부 보여준다. 이전 제품과 비교해 가장 눈에 띄는 변화는 후면 재질이 유리가 아닌 플라스틱이라는 점이다. 고급스러운 느낌이 덜하고 확실히 최고급 제품이라고 착각할 만한 제품은 아니다. 반면 무게는 190g으로 상대적으로 가볍다. 모서리가 곡면이어서 잡기가 매우 편하다. 심지어 한 손으로도 사용할 수 있는데 다른 최신 폰과 확실히 다른 부분이다. 낫싱 폰 (2a)에는 낫싱 폰하면 떠오르는 특징인 LED 라이트 '글리프(Glyph) 인터페이스'도 적용됐다. 하지만 크기는 줄었다. 휴대폰 뒷면 거의 전체를 아우르는 대신 카메라 모듈 주변에 3개만 배치했다. 이전 낫싱 폰의 독특한 디자인을 좋아했다면, 이런 변화가 실망스러울 수 있다. 하지만 필자는 개인적으로 덜 눈에 띄는 이 제품이 더 호감이 간다. 글리프가 작동하는 방식은 낫싱 폰 (2)와 같다. 깜빡이거나 부분적으로 켜지는데, 특히 후자의 방식으로 소리 크기나 타이머 진행 상황을 보여준다. 이런 정교한 표현은 낫싱 폰 (1)에서 개선된 점이다. 글리프의 가장 큰 역할은 전화 수신이나 다른 알림 사항을 사용자가 알 수 있게 하는 것이다. 연락처나 앱에 따라 다르게 설정할 수 있으므로, 화면을 보지 않고도 누가 전화했는지, 어떤 앱의 알림인지 알 수 있다. 이론적으로는 이를 통해 휴대폰 화면을 확인하는 횟수를 줄일 수 있을 것 같지만, 안타깝게도 필자가 실제 사용해 보니 꼭 그렇지는 않았다. 오히려 벨소리가 나거나 진동하는 것만큼이나 방해가 됐다. 어떤 앱이 알림을 보내는지 알고 있어도 알림 내용을 확인해야 한다는 의무감 같은 것이 들었다. 모르는 번호로 걸려 오는 정상적인 전화를 받아야 하는 필자 같은 직업의 사람은 글리프만 보고 중요하지 않은 전화라고 확신할 수도 없다. 따라서 이 글리프 시스템은, 몇몇 가까운 사람의 전화만 받고 소수의 중요한 앱의 알림을 즉시 확인하고 싶은 이들에게만 유용하다. 그렇지 않은 상황이라면 오히려 스마트워치를 사용하는 것이 휴대폰 화면을 덜 보는 더 좋은 방법일 수 있다. 한편 낫싱 폰 (2a)의 특징과 장점은 글리프만이 아니다. 휴대폰 뒷면 중앙에 돌출된 카메라 영역은 다른 부분과 잘 조화를 이룬다. 단, 마치 사람의 두 눈 같은 느낌이 드는 것은 어쩔 수 없다. 업체는 낫싱 폰 (2a)의 디자인이 뉴욕시 지하철 노선도에서 영감을 얻었다고 설명했고, 어떤 부분은 비슷한 것 같기도 하다. 필자가 테스트한 블랙 색상 제품은 외관이 차분하고, 이 외에도 밀크(클라우디 화이트)와 트루 화이트 모델도 있다. 낫싱 폰 (2a)는 제품 후면이 플라스틱인데도, 지문이 많이 묻어났다. 손에 착 붙는 느낌이 있는 것도 아니어서 케이스를 사용하는 것이 추천한다. 업체에 따르면 낫싱 폰 (2a)는 내구성도 개선했다. 새로운 유니바디는 낙하 테스트에서 낫싱 폰 (2) 이상의 성능을 보였다고 한다. 필자도 이 제품을 사용하면서 흠집이 생길까 걱정하지는 않았다. 반면 휴대폰 전면은 확실히 더 깨지기 쉽다. 특히 글리프를 사용하려고 휴대폰을 뒤집어서 책상 위에 올려놓았을 때는 더 그렇다. 필자는 테스트 과정에서 이렇게 사용하면서 이미 전면 화면에 많은 흠집이 생겼다. 업체에서 미리 보호 필름을 부착해 판매하면 좋을 것 같다. 낫싱 폰 (2a)의 방수 등급은 IP54로 이전 제품과 같다. 물이 튀는 정도만 보호하고 완전한 방진 기능을 제공하지 않는다는 의미다. 대부분 고가 스마트폰이 지원하는 IP68에는 미치지 못하는 사양이지만, 저가폰 중에서 비교하면 떨어지는 수준은 아니다. 한 가지 더 눈에 띄는 디자인 요소는 바로 소리 조절이다. 조절 버튼이 기기 왼쪽에 있는데, 휴대폰을 사용할 때 가장 자연스러운 위치다. 반대편에 있는 전원 버튼을 길게 누르면 전원 옵션이 나타난다. 전원 버튼은 구글 어시스턴트를 실행하도록 설정할 수도 있다. 화면과 스피커 6.7인치 AMOLED 화면 120Hz 주사율 듀얼 스테레오 스피커 낫싱 폰 (2a)의 디스플레이는 경쟁사의 최고급 휴대폰과 비교할 수 있을 정도다. 6.7인치 AMOLED 패널은 해상도가 2.4K(2412×1084)로 약간 떨어지지만, 여느 고성능 폰만큼이나 훌륭하다. 결과적으로 화면에서 보이는 콘텐츠는 매우 선명하고 또렷하며 1440p 혹은 4K 패널과 비교해도 차이가 느껴지지 않는다. OLED를 사용했다는 것은 곧 풍부하고 생생한 색감에 딥 블랙을 지원한다는 의미다. 안드로이드를 기반으로 낫싱이 만든 운영체제의 모든 것이 이런 화면의 장점을 충분히 활용한다. 결과적으로 훌륭한 화면과 낫싱 OS의 결합은 인상적이다. 낫싱 폰 (2a)의 화면은 웹 브라우징이나 이메일 작업 등에 탁월하다. 영상을 보거나 소셜 미디어를 확인하는 데도 모자람이 없다. 120Hz 주사율의 장점도 있다. 기기가 사용자의 작업에 따라 자동으로 주사율을 30~120Hz로 조절하는 기본 '다이내믹' 모드를 기준으로, 여러 메뉴를 이동하는 것이 매우 부드럽고 빠릿빠릿하다. 다이내믹 모드를 통해 배터리 사용 시간을 늘릴 수 있다. 반면 LTPO 디스플레이는 아니어서, 주사율을 1Hz까지 낮출 수는 없다. 사용자가 수동으로 60Hz, 120Hz로 고정할 수는 있다. 필자가 화면에서 한 가지 불편했던 것은 가시성이었다. 최대 밝기로 했는데도 700니트가 안 됐고, 이는 한낮에 밖에서 화면을 볼 때 내용을 파악하는 데 조금 어려움이 있었다. 화면 자체는 완전한 평면이고 주변을 얇은 대칭의 베젤이 감싸고 있다. 앞에서 보면 낫싱 (2a)는 현재 판매 중인 가장 예쁜 휴대폰 중 하나라고 해도 과언이 아니다. 화면에는 지문 인식기가 내장돼 있는데, 필자가 그동안 써봤던 기기 중 최고 수준이었다. 95% 정도로 빠르게 잠금을 해제했다. 얼굴 잠금 해제 기능도 있지만 지문 인식기가 훨씬 더 안전하다. 한편 음질 관련해서 낫싱 폰 (2a)에는 듀얼 스테레오 스피커가 적용됐다. 하방 그릴과 수화기가 결합한 흔히 볼 수 있는 구조다. 출력이 꽤 좋고 높은 볼륨에서도 소리가 왜곡되지 않는다. 반면 저음이 부족하므로 영화를 보거나 제대로 된 음악 감상 용도로는 적합하지 않다. 소셜 미디어를 보거나 가끔 유튜브 동영상을 재생하는 정도로는 충분하다. 사양과 성능 미디어텍 디멘시티 7200 프로 8GB, 12GB RAM 128GB, 256GB 스토리지 낫싱 폰 (2a)에는 디멘시티 7200 프로(Dimensity 7200 Pro)가 사용됐다. 낫싱이 미디어텍과 협업해 별도 제작한 칩셋으로, 업체는 '최고의 성능과 최적의 전력비를 갖춤 제품'이라고 설명했다. 낫싱 폰 (1), 폰 (2)에서 모두 퀄컴 스냅드래곤 칩셋을 사용한 것을 고려하면, 이번 제품에서 미디어텍 칩셋으로 교체한 것은 다소 놀라운 결정이다. 낫싱 측은 내부 테스트 결과 디멘시티 7200 프로가 비슷한 스냅드래곤 칩인 7s 젠 2, 782G보다 더 좋은 성능을 보였다고 설명했다. 실제로 필자가 이 기기를 몇 주 사용해 보니, 낫싱 폰 (2a)의 성능에 감탄하지 않을 수 없었다. 매우 뛰어난 성능을 보여줬고, 휴대폰에서 하는 일반적인 작업을 여유 있게 처리했다. 테스트하는 동안 필자는 상당히 많은 웹 브라우징, 이메일, 사진 기능을 사용했고 가끔 텍스트 작업을 하고 유튜브 영상도 봤다. 이 과정에서 버벅대거나 속도가 느려지는 느낌을 전혀 받지 못했고, 심지어 앱 사이를 전환할 때도 마찬가지였다. 낫싱 폰 (2a)는 멀티태스킹을 매우 잘 처리했다. 반면 게임 경험은 완벽하다고 할 수 없었다. 종종 프레임이 떨어졌다. 하지만 다른 저가 제품과 비교하면 여전히 기대 이상이다. 콜 오브 듀티 모바일, PUBG 모바일, EA 스포츠 FC 모바일, 아스팔트 9 : 레전드 같은 게임은 플레이하는 데 문제가 없었다. 단, 몇 분이 지나면 휴대폰 뒷면이 뜨거워지는 것이 느껴졌다. 필자가 테스트한 제품은 12GB RAM 모델인데, 8GB 제품에서 성능이 크게 떨어질 것 같지는 않다. 성능은 낫싱 폰 (2a)의 분명한 장점이다. !function(e,n,i,s){var d="InfogramEmbeds";var o=e.getElementsByTagName(n)[0];if(window[d]&&window[d].initialized)window[d].process&&window[d].process();else if(!e.getElementById(i)){var r=e.createElement(n);r.async=1,r.id=i,r.src=s,o.parentNode.insertBefore(r,o)}}(document,"script","infogram-async","https://e.infogram.com/js/dist/embed-loader-min.js"); 필자가 테스트한 제품의 내부 저장소 용량은 256GB이다. 시스템 파일이 17GB 정도 차지하는데, 이를 제외해도 대부분 사용자에게 충분한 용량이다. 듀얼 심카드를 지원하지만, 마이크로 SD로 확장할 수는 없다. 최신 휴대폰이 대부분 그런 것처럼, 디멘시티 7200 프로는 5G를 기본으로 지원한다. 이밖에 와이파이 6, 블루투스 5.3, 모바일 결제용 NFC를 지원한다. 연결성에 있어서는 비판할 부분이 없다. 카메라 50Mp 메인 후면 카메라 50Mp 광각 32Mp 전면 비슷한 가격대의 다른 스마트폰과 비교해 낫싱 폰 (2a)의 카메라 사양은 그리 눈에 띄지 않는다. 총 3개 렌즈가 있는데, 후면에 50Mp 2개(메인, 광각), 전면에 32Mp 1개다. 망원렌즈, 접사렌즈 혹은 깊이 감지 센서는 없다. 대신 낫싱은 확실하게 카메라의 양보다 질에 집중했다. 그리고 다행스럽게도 더 비싼 낫싱 폰 (2)의 카메라 화질과 비슷한 수준까지 구현해 냈다. 낫싱 폰 (2) 카메라에 대한 평가를 거의 그대로 낫싱 폰 (2a)에 적용할 수 있을 정도다. 즉, 빛이 좋을 때는 메인 렌즈로 찍은 사진 역시 준수하다. 낫싱의 이미지 처리 과정을 거치면 사진이 조금 과하게 실제보다 색상과 대비가 강해지는 측면이 있다. 전반적으로 디테일과 다이내믹 레인지가 훌륭하지만, 실제와 가깝게 촬영하는 카메라는 아니다. 안타깝게도 노출은 종종 오동작한다. 특히 하늘을 촬영할 때 이런 증상이 자주 나타났다. 몇몇 사진은 괜찮았지만 다른 경우에는 전체적으로 좋지 않았다. 밝은 햇빛에서 이런 증상이 도드라졌고, 오히려 저조도 환경에서 더 안정적으로 작동했다. 장노출 야간 모드에서는 디테일을 희생하지 않고도 어두운 이미지를 매우 밝게 처리한다. 노이즈가 최소로 유지되고 일반 모드로 촬영할 때와 분명하게 차이가 나타났다. 인물 모드는 훌륭했다. 배경을 적당하게 블러 처리하고 인물을 잘 부각시킨다. 종종 인물과 배경 사이 경계를 제대로 인식하지 못하는 오류가 있지만, 대부분 스마트폰 카메라가 같은 문제를 갖고 있다. 인상적인 것은 광각 촬영이었다. 화각이 114도까지 확장되는데도 화질 저하가 없었다. 단, 색은 다소 바래는 느낌이 있었다. 후면 렌즈 2개 중 하나를 택하라면 망원보다 초광각이지만, 줌 기능 관련해서 장단점이 뚜렷하다. 낫싱 폰 (2a)는 광학 줌 기능이 전혀 없고, 디지털 줌을 최대 10배까지 지원한다. 카메라 앱에서 2배 이상 확대하면 입자가 거칠어지고 디테일이 떨어진다. 전면 카메라는 디테일이 풍부한 생생한 사진을 찍을 수 있어 만족스럽다. 인물 모드에서는 다른 스마트폰보다 더 많은 부분을 잘라내기는 하지만, 배경과 인물을 잘 분리한다. 영상은 최대 4K, 30fps까지 촬영할 수 있지만 대부분 기본값인 1080p, 30fps만으로도 충분히 좋다. 메인 카메라가 OIS를 지원하므로 움직이며 촬영해도 꽤 안정적인 동영상을 얻을 수 있다. 전반적으로 낫싱 폰 (2a)의 카메라는 준수하다. 하지만 카메라를 이 스마트폰의 장점이라고 내세울 정도는 아니다. 꽤 훌륭한 사진을 얻을 수는 있지만, 모든 조건에서 그런 것은 아니고 오히려 몇 가지 결정적인 약점이 있다. 배터리 사용 시간과 충전 5000mAh 배터리 매우 훌륭한 배터리 사용 시간 45W 유선 충전, 무선 충전 미지원 낫싱 폰 (2a)에는 5000mAh 베터리가 들어갔다. 폰 (1), 폰 (2)보다 더 커졌다. 덕분에 배터리 사용 시간도 충분하다. 대부분은 한번 충전해 하루 종일 쓸 수 있다. 필자는 바르셀로나를 돌아다니며 테스트해 봤는데, 하루는 오전 11시에 완전 충전한 상태로 집을 나서서 9시간 정도 내비게이션을 계속 사용하고 사진을 촬영하고 일반적인 웹을 사용했는데도, 집에 돌아왔을 때 20% 정도 남아 있었다. 낫싱은 최대 이틀까지 사용할 수 있다고 주장하는데, 더 간단하게 사용하면 가능할 것도 같았다. 200니트 밝기로 다양한 작업을 하는 PC마크 배터리 테스트 결과 배터리 사용 시간은 16시간 16분이었다. 현재 판매되는 휴대폰 중 가장 배터리 사용 시간이 좋은 수준이다. 하지만 안타깝게도 충전 기능은 인상적이지 않다. 낫싱 폰 (2a)는 유선 45W만 지원하고 충전기는 함께 제공하지 않는다. 필자는 65W 충전기를 사용했는데, 완전히 충전하는 데 45분이 걸렸다. 삼성 제품과 비교하면 느린 속도는 아니지만, 충전 속도가 가장 빠른 제품과 비교하면 많이 떨어진다. 무선 충전을 지원하지 않는다는 점도 언급할 필요가 있다. 하지만 제품 가격을 고려하면 놀랄 일도 아니다. 소프트웨어와 앱 안드로이드 14 기반의 낫싱 OS 2.5 다양한 맞춤 설정 옵션 3년간 OS 업데이트, 4년간 보안 패치 제공 낫싱 폰 (2a)는 안드로이드 최신 14 버전 기반의 낫싱 OS 2.5 스킨으로 작동한다. 이 스킨이 제공하는 경험은 다른 안드로이드 폰과 완전히 다르다. 낫싱 측에 따르면, 방해하는 요소를 줄이고 사용자가 의도하는 작업을 더 쉽게 할 수 있도록 하는 데 초점을 맞췄다. 글리프 인터페이스를 전면에 내세운 것도 같은 맥락이다. 휴대폰 뒷면의 LED 라이트, 즉 글리프를 매우 다양하게 맞춤 설정할 수 있다. 밝기를 조절하거나 사용자 지정 벨소리를 설정하고 재생 중인 음악에 맞춰 바뀌게 할 수도 있다. 현재는 시계 앱과 구글 캘린더, 우버, 조마토(Zomato) 앱에서 글리프를 진행 표시줄로 사용할 수 있는데, 업체는 더 다양한 앱에서 글리프를 사용할 수 있도록 글리프 개발자 키트를 내놓았다. 흑백 테마와 아이콘 팩을 이용하면 밝은 색상의 앱 고유 색깔을 쓰지 않고 낫싱 OS 스킨과 분위기를 맞출 수 있다. 앱을 새로 다운로드하면 컬러 버전의 앱으로 표시되지만, 이때 낫싱 아이콘 팩을 적용하면 바뀐다. 이밖에 낫싱은 홈 화면과 잠금 화면에 사용할 수 있는 자체 위젯 22종을 직접 만들었다. 평범한 디자인은 아닌데, 전체적인 테마와 잘 어울린다. 필자는 이 복고풍 디자인이 꽤 마음에 들지만, 모든 사람이 좋아할 위젯은 아니다. 낫싱 폰 (2a)의 블로트웨어는 최소 수준이다. 필자가 찾은 것은 이어버드 관리 앱인 낫싱 X, 녹음기, 날씨 앱 정도다. 낫싱은 일반적인 안드로이드 환경에 매우 사려 깊게 기능을 추가했고, 결과적으로 이를 사용하는 것은 매우 즐거운 경험이다. 업체는 3년간 OS 업데이트를 제공하고, 4년간 보안 업데이트를 지원한다. 업계 최고 수준은 아니지만 적당한 수준의 기술지원 기간이다. 낫싱 폰 (2a)를 구매하면 2028년까지 지원을 받을 수 있다. 매력적이고 저렴한 휴대폰 낫싱 폰 (2a)의 가격은 꽤 경쟁력이 있다. 8GB RAM, 128GB 스토리지 모델이 319유로부터 시작한다. 여기서 테스트한 12/256GB 모델은 349달러다. 필자가 사는 영국을 기준으로 낫싱 웹사이트(한국 사이트는 )에서 사전 주문할 수 있고 정식 출시일은 3월 12일이다. 낫싱 폰 (2a)는 현재 판매되는 보급형 휴대폰 중 가장 저렴한 제품 중 하나다. 하지만 샤오미 리드미 노트 13 프로(339유로), 삼성 갤럭시 A34 5G(349유로), 포코 X6 프로(369유로), 모토로라 엣지 40 네오(300유로) 같은 제품을 함께 살펴볼 필요가 있다. 낫싱 폰 (2a)는 매력적으로 저렴한 휴대폰이지만, 모든 사람에게 적합한 제품은 아닐 수 있다. 성능은 비슷한 가격대 제품 중 최고이고, 게임을 포함한 거의 모든 용도로 탁월하다. 120Hz OLED 화면은 몰입적인 시청 경험을 제공하고, 스피커도 평균 이상이다. 배터리 사용 시간은 충분히 길고, 소프트웨어를 세련되게 만드는 데 많은 공을 들였다. 실제로 LED 라이트를 이용한 글리프 인터페이스는 유용성에 논란이 있을 수 있지만, 사람들 사이에서 바로 눈에 띄는 것은 분명하다. 단, 카메라는 불안정하고 충전 속도가 경쟁 제품보다 느리다. 이런 점은 구매 전에 반드시 알고 있어야 한다. 낫싱 폰 (2a)는 꽤 좋은 휴대폰이지만 비슷한 다른 업체 제품과 비교해 볼 필요가 있다. 상세 사양 미디어텍 디멘시티 7200 프로 칩셋 8/12GB RAM 128/256GB 스토리지 6.7인치, 2412×1084 120Hz OLED 디스플레이 50Mp, f/1.88 OIS 메인 카메라 50Mp, f/2.2 광각 카메라 32Mp, f/2.2 전면 카메라 5000mAh 배터리 45W 유선 충전 5G 듀얼 스테레오 스피커 와이파이 6 블루투스 5.3 NFC 글리피 인터페이스 LED 라이트 IP54 방수와 방진 안드로이드 14 기반의 낫싱 OS 2.5 161.74×76.32×8.55mm 190g editor@itworld.co.kr
애플의 비전 프로(Vision Pro) 공간 컴퓨터는 패스스루 영상과 손/눈동자 추적을 지원하는 VR 헤드셋이다. 하지만 흔한 VR 헤드셋 중 하나라고 하기에는 부족하다. 고화질 디스플레이가 달린 '훨씬 비싼' 메타 퀘스트 3이라는 표현도 적절하지 않다. 실제로 필자가 지난 몇주동안 매일 애플 비전 프로를 사용해 보니 이 기기의 가치를 직감적으로 알 수 있었다. 미래의 어느 시점에 우리 모두가 사용하는 제품이 될 것이라는 직감말이다. 그리고 머리 속에 한 가지 생각이 떠올랐다. "이거 정말 멋진 기기가 되겠는걸, 언젠가는 말이지" 이 제품의 한계도 바로 이 지점이다. 이 제품의 진정한 가치가 바로 지금이 아니라 저 멀리 어딘가에 있는 것처럼 느껴진다는 점이다. 결과적으로 비전 프로를 사용한다는 것은 타협과 비효율 사이에서 시행착오를 통해 접점을 찾는 과정이다. 콘텐츠를 즐기는 기능 자체에도 단점이 상당히 많다. 실제로 비전 프로를 사용하다 보면, 조금 더 가벼웠더라면…, 덜 비쌌더라면…, USB-C 기기를 직접 연결할 수 있었다면…, 더 많은 앱이 있었다면…, 앱의 완성도가 더 높았다면…, 끊임없이 아쉬운 점이 떠오른다. 제품을 처음 받아서 실행한 후 초기의 놀라운 순간이 지나가면 (때로는 탄성이 저절로 나온다!) 이 기능은 언제 되는거야? 이건 왜 안돼?, 라는 생각이 꼬리를 문다. 결국 필요한 작업을 제대로 하기 위해 맥이나 아이패드, 아이폰을 집어들게 된다. 비전 프로의 이런 단점 중 일부는 소프트웨어 업데이트로 해결할 수 있다. 하지만 일부는 하드웨어와 관련된 문제다. 결과적으로 당장은 이 머리에 쓰는 비싼 컴퓨터를 구매하라고 추천하기 어렵다. 애플 제품에 열광하는 얼리 어답터가 아니라면 말이다. 놀랍지만 한계가 뚜렷한 하드웨어 아마도 이 글을 읽고 있다면 이미 애플 비전 프로의 사용자 시점 화면이나 리뷰 영상을 여러 개 찾아 봤을 것이다. 하지만 이런 영상이나 사진으로는 비전 프로의 사용자 경험을 제대로 전달할 수 없다. 직접 이 제품을 착용해 경험한 애플의 마이크로 OLED 디스플레이는 색정확도나 색감, 다이내믹 레인지 등이 놀라울 만큼 훌륭하다. 픽셀이 전혀 보이지 않고 스크린 도어 효과(screen door effect, 해상도가 낮아서 화소 사이에 검은 격자무늬가 보이는 것)도 없다. 특정 조명하에서는 렌즈에서 약간의 반사가 나타나지만 다른 헤드셋과 비교하면 현저하게 적다. 메타 퀘스트 3 같은 기기와 애플 비전 프로로 보는 콘텐츠를 비교하면 마치 오래된 1080p TV와 최신형 4K HDR OLED 화면의 차이 정도다. 애플은 이를 위해 엄청난 공을 들였는데, 포비티드 렌더링(foveated rendering)이 대표적이다. 전체 화면 중 사용자가 바라보는 일부분만 최고 화질로 렌더링하고 나머지는 약간 흐릿하게 보여준다. 실제로 사람의 눈이 이런 방식으로 작동한다. 추적 기능은 마치 마법처럼 작동한다. 비전 프로를 쓰고 화면에서 어떤 요소를 응시하면 즉시 해당 요소가 강조된다. 이 상태에서 손가락을 꼬집는 동작을 하면 선택이 된다. 이때 손은 편안하게 아래 쪽에 놓아도 상관없다. 사용자 앞쪽 허공을 좌우로 넘기거나 찌르는 과격한 동작이 필요 없다. 바로 옆에 다른 사람이 있어도 유심히 보지 않으면 내가 무슨 동작을 하는지 알 수 없을 정도다. 비전OS가 화면 내에서 상호 작용하는 주요 방식이 바로 이 "응시하고 꼬집는다"이다. 이는 기술적으로 매우 인상적이면서 동시에 한계가 있다. 지난 수년간 멀티터치 인터페이스를 사용하다보니 한 손당 하나의 터치만 가능하다는 것이 마치 제약처럼 느껴진다. 화면 속 한 요소를 계속 응시하는 것도 약간의 적응이 필요하다. 흥미가 가는 사물을 응시하는 것은 사람의 본능이다. 하지만 동시에 시선을 돌리는 것도 자연스러운 행동인데 비전 프로에서는 이 후자를 의식적으로 자제해야 한다. 즉, 어떤 인터페이스 요소를 실행하려면 고개를 돌리지 않고 계속 그 요소를 바라보고 있어야 한다. 조명 스위치를 끈다고 생각해보자. 보통은 손이 스위치를 향해 정확히 움직일 정도만 응시하고 시선을 돌리게 된다. 그런데 비전 프로는 스위치를 끄는 동작이 완료될 때까지 스위치를 계속 바라보도록 요구한다. 비전OS 내에서 앱을 실행한 창을 사용자 시선에 더 가깝게 가져오면, 문자그대로 이 창을 직접 터치해 스와이프할 수 있다. 단지 촉각 피드백이 없을 뿐이다. 이는 마치 유령과 싸우는 느낌이다. 현재 상태로도 놀랍도록 잘 작동하지만 한두 세대 더 발전하면 훨씬 더 직관적이고 유연해질 것으로 기대된다. 패스스루 영상도 비슷하다. 비전 프로를 착용하고 바라보는 영상의 화질은 비슷한 헤드셋 제품 중 가장 뛰어나지만 그럼에도 충분히 좋은 것은 아니다. 애플은 포톤인-포톤아웃(photon-in-to-photons-out, 반응 속도) 지연시간을 12밀리초 혹은 그 이하로 구현했지만, 밝은 곳을 제외하면 영상에 노이즈가 나타나고 색상이 제대로 구현되지 않는다. 필자의 집은 많이 어두운 것도 아닌데, 일상적인 조명에서는 색이 충실히 재현되지 않았다. 평소보다 더 많은 조명을 켜야 제대로 보였다. 반면 스트랩에 내장된 작은 스피커의 음질은 놀라울 만큼 훌륭했다. 볼륨을 높이면 주변사람에게 들리는 문제가 있지만, 외부를 바라볼 때 주변의 소리와, 비전 프로 앱을 사용할 때 나오는 공감 음향을 함께 듣는 데는 전혀 불편함이 없다. 에어팟 프로를 사용하면 내가 보고 있는 콘텐츠의 소리를 다른 사람이 듣는 것을 막을 수 있지만, 이렇게 하면 주변의 소리를 전혀 들을 수 없게 되는 단점이 있다. 즉 결과적으로 고립된 몰입형 경험에는 최적이지만, 증강현실 측면에서는 적합하지 않은 셈이다. 스트랩은 제 역할을 충분히 한다. 듀얼 루프 밴드는 헤드셋 무게를 골고루 분산한다. 라이트 씰은 착용감이 좋고 외부의 빛을 효과적으로 차단한다. 반면 부착되는 마그네틱 자력이 강하지 않아서 라이트 씰만 잡고 비전 프로를 들어올리면 자칫 비전 프로를 바닥에 떨어뜨릴 수 있다. 애플 역시 라이트 씰이 아니라 전면 디스플레이를 잡고 비전 프로를 사용하라고 안내한다. 비전 프로의 무게는 600~650g이다. 무게 자체만 보면 별거 아닌 것 같지만, 이 무게를 머리 전체가 아니라 얼굴 앞면으로 지탱해야 하는 것이 문제다. 실제로 제품을 착용하면 라이트 씰에서 상당한 압박감이 느껴진다. 애플은 플라스틱에 대해 '집착적인 거부감'으로 알루미늄과 유리를 사용해 고급스러운 느낌을 구현했지만, 150~200g 더 가벼워질 수 있다면 필자는 플라스틱 제품 쪽에 손을 들어주고 싶다. 비전 프로 전면 전체는 광택이 상당하다. 그래서 정작 전면 디스플레이 내용을 확인하기 어렵고 비전 프로의 대표 기능인 '아이사이트(EyeSight)'도 선명하지 않다. 아이사이트는 분명 괜찮은 아이디어지만 결과적으로 애플이 광고한 대로 작동하지 않는다. 오히려 제품을 복잡하게 만들고 가격을 올리는 역할만 하는 느낌이다. 외장 배터리의 경우 불편해 보이지만 방향은 잘 잡았다고 본다. 실제 사용할 때 크게 거슬리지는 않았고, 머리에 쓰는 헤드셋에서 무언가를 빼내 무게를 줄이는 것은 언제나 환영이다. 결국은 이 모든 것이 하나의 기기에 통합되겠지만, 향후 몇년 동안은 배터리 팩을 밖으로 빼 헤드셋을 더 가볍게 만드는 것이 유행할 전망이다. 이 배터리 팩에는 데이터를 주고받는 기능이 전혀 없다. 배터리 팩에 USB-C 포트가 달려 있지만 오직 전원을 공급 받는 역할만 한다. 여기에 다른 주변기기를 연결해도 전혀 인식하지 못한다. 반면 애플은 디벨로퍼 스트랩(Developer Strap)을 300달러에 판매한다. 기존 오디오 스트랩 자리에 갈아 끼울 수 있는 제품으로 USB-C 동글이 달려 있어서 이를 통해 애플 비전 프로와 맥을 직접 연결할 수 있다. 미완의 소프트웨어 비전 프로를 둘러싼 소프트웨어 상황은 아무리 좋게 표현해도 '걸음마 단계'다. 소프트웨어를 이용해 지난 수십년간 세계 최대이자 세계 최고 시가총액 지위를 누려 온 애플도 비전 프로라는 신제품의 앱과 인터페이스의 제약을 극복하는 것은 쉽지 않았던 것으로 보인다. 몰입형 영상과 일부 게임 등 높은 완성도를 지난 앱도 있지만 이를 제외하면 거의 모든 것이 공간에 떠다니는 '아이패드 창' 정도로 느껴진다. 설사 아이패드에서는 쓸 수 없는 비전 프로 전용 앱이라고 해도 말이다. 앱 창도 크기를 자유롭게 조절할 수 있지만 맥에서 보는 것을 그냥 키워 놓은 것처럼 보인다. 서드파티 앱은 대부분 아이패드 앱이고, 비전OS 전용 앱은 채 1,000종이 안 된다. 그마저도 급조된 것처럼 느껴진다. 종종 오류가 발생했고, 단지 아이패드 앱을 공간에 떠다니는 창으로 약간 수정한 것에 불과한 것도 많았다. 결과적으로 '공간' 기능도 조잡하다. 예를 들어 캐럿 웨더(Carrot Weather)는 훌륭한 앱이지만 아이패드 앱과 차이가 거의 없다. '지구본 보기(full globe)' 팝업 기능을 실행하면 '멋진데!'라는 말이 절로 나오지만 실제로 유용한가 생각하면 그렇지 않다. 차라리 사용자가 실제 주변이나 하늘을 바라볼 때 등압선과 강수량 같은 정보를 보여주는 것이 더 좋지 않았을까. 실제로 비전 프로의 경험 대부분은 앱을 실행한 떠다니는 창을 사용자 주변 특정 위치에 고정해 쓰는 것이다. 이 기술적인 성취를 과소평가할 생각은 없다. 창은 놀라울만큼 또렷하고 생생하게 내 주변 환경의 일부로 나타난다. 동시에 실세 세계에서 적절하게 공간을 차지하고, 평평한 창의 하단에 그림자가 생기는 것은 물론 단 1mm도 흔들리지 않는다. 하지만 이들 창은 항상 사용자가 아니라 특정 위치를 기준으로 고정된다. 이동하면서 창이 사용자를 따라다니도록 하려면 창의 아래쪽에 있는 작은 막대를 '문자그대로' 집은 채로 움직여야 한다. 실제로 필자는 비전 프로를 테스트하면서 실행 중인 앱의 창을 찾지 못하는 기이한 경험을 종종 했다. 그 창이 다른 방에 있었기 때문이다. 비전 프로를 착용하고 처음 집안을 돌아다니면서 사파리 창이 있는 방을 찾는 경험은 특별할 수 있다. 하지만 이것이 반복되면 짜증스럽다. 창을 거실에 고정하는 대신 창 막대를 더블 핀치해서 해당 창을 사용자에게 고정할 수 있다면 어땠을까? 비전OS 2.0에 이 간단한 기능이 추가된다면 꽤 획기적으로 느껴질 것이다. 또한 여러 앱을 동시에 실행하면 물리적인 주변 공간이 금세 좁게 느껴진다. 창을 사용자 주변의 여러 사물 위에 배치하는 것은 번거로운 작업이고 원하는 앱을 선택해 전환하기가 생각만큼 쉽지 않다. 결국 이들 커다란 창을 내방 책상이나 거실 소파 같은 곳의 공중에 띄워 놓게 되고 다른 앱을 사용하려면 이리저리 돌아다녀야 하는 상황이 된다. 앞서 설명한 것처럼 처음에는 이런 경험이 놀랍다. 하지만 어느새 "이 많은 창을 어디에 둬야 하지?" 묻는 자신을 발견하게 된다. 창 관리 기능이 부실한 것도 언급할 필요가 있다. 비전 프로에는 맥의 미션 컨트롤(Mission Control)처럼 모든 창을 모으고 정렬하는 기능이 없다. 아이패드의 스플릿 뷰(Split View) 같은 것도 없어서 두 앱을 나란히 붙여서 사용할 수도 없다. 스테이지 매니저(Stage Manager) 같은 기능이 있다면 여러 앱을 하나의 스택으로 묶은 후에 이 스택 사이를 전환하며 앱을 찾는 것도 방법일 수 있다. 이를 이용하면 실행하려는 앱의 창을 어디에 놓아야 할지 새로운 공간을 고민할 필요가 없어진다. 하지만 이런 기능도 역시 없다. 앱 관리의 문제는 현재 실행하고 있는 앱에만 해당하는 것이 아니다. 홈 뷰는 사용할 수 있는 앱의 작은 아이콘을 벌집 형태로 정렬해 보여준다. 첫 페이지는 애플이 만든 앱으로 꽉 차 있고 위치도 고정돼 있다. 두번째 페이지부터 사용자가 설치한 앱이 알파벳 순서로 정렬된다. 그런데 첫 페이지가 알파벳 순서 정렬이 아닌 것이 혼란스럽고, 순서를 변경할 방법이 없어서 매우 불편하다. 특히 아이폰과 아이패드, 맥에는 독(dock)이 있지만 비전 프로에는 독 같은 것이 없어 당혹스럽다. 비전OS 2.0에서 가장 먼저 개선해야 할 것은 단연 홈 뷰와 앱 관리 기능이다. 사실 뻔히 보이는 단점과 해결책도 명확하지만, 실제 비전 프로를 착용하고 현실에 앱을 배치하는 경험이 매우 놀라운 것도 사실이다. 당장은 모든 것이 부족하게 느껴지지만, 앱을 원하는 공간에 배치할 수 있다는 것이 얼마나 유용할지는 비전 프로를 처음 사용하는 순간 직감할 수 있다. 예를 들면 집안 냉장고에 AI를 활용해 작성되는 장보기 리스트를 고정할 수 있다. 지금은 직접 종이에 쓴 메모를 자석으로 붙여놓는 식이지만 이를 대체할 수 있다. 이뿐만이 아니다. 찬장과 냉장고를 열 때마다 부족한 식재료가 자동으로 업데이트되고 식료품점에 갈 때 이 내용을 팝업으로 보여준다. 이 팝업은 사용자를 계속 따라다니고 식료품점에 도착하면 필요한 물품이 있는 진열대가 강조돼 표시된다. 이처럼 현재는 구현된 기능이 아니라고 해도, 컴퓨터가 만든 그래픽을 실제 세계와 통합해 상호작용과 지능, 위치, 개인적인 선호도를 결합했을 때 이 기술의 가능성은 무한히 확장한다. 우리는 오랫동안 이런 세상을 상상했지만, 비전 프로는 상상을 현실로 실제로 만들어 줄 것처럼 느껴지는 첫 제품이다. 어쩌면 이런 세상이 도래하는 것도 그리 머지않은 미래일지 모른다. 이밖에 비전 프로에서 누락됐거나 제대로 구현되지 않은 앱도 언급할 필요가 있다. 일단 계산기와 날씨 앱이 없다. 나의 찾기(Find My)로 비전 프로 제품의 위치를 확인하는 것도 불가능하다. 친구나 다른 애플 기기를 찾는 것도 안 된다. 애플의 자체 앱 중 '공간' 컴퓨팅에 가장 잘 어울릴 앱이 바로 지도일텐데 현재는 아이패드 앱을 사용할 수 있는 것이 전부다. 연락처 앱도 기이하다. 앱은 없지만 앱 내에서 연동해 사용하는 것은 가능하다. 단지 비전 프로에서 연락처를 관리할 수 있는 앱이 없을 뿐이다. 홈 뷰의 왼쪽에 피플(People) 섹션이 있다. 비전 프로에는 페이스타임 앱이 없고, 이 피플 섹션에서 페이스타임을 시작해야 한다. 이 모든 것을 보면 비전 프로는 아직까지 미완의 상태인 것처럼 느껴진다. 일부 앱과 경험은 매우 뛰어나지만, 일부는 불완전하거나 아예 누락됐다. 비생산적인 생산성 비전 프로의 키보드는 놀랍도록 조악하고 URL을 입력하는 것 이외에는 거의 쓰기가 불가능할 정도다. 문장을 입력하려면 블루투스 키보드가 필수다. 음성 받아쓰기도 가능하지만 아이폰이나 아이패드의 같은 기능보다 훨씬 떨어진다. 수정하기 위해 '응시하고 꼬집는' 방식으로 텍스트를 선택하는 것이 매우 불편하기 때문이다. 따라서 비전 프로를 이용해 업무를 보려면 최소한 키보드와 트랙패드가 필요하고 맥북을 사용하는 것이 가장 좋다. 맥북을 사용하는 방법은 이렇다. 비전 프로를 착용한 상태에서 비전 프로와 같은 애플 ID로 로그인된 맥북을 바라보면 맥북 화면의 바로 위에 '연결(Connect)' 버튼이 나타난다. 이를 꼬집어 선택하면 공중에 떠다니는 4K 가상 화면이 나타난다. 이 화면의 화질은 매우 뛰어나고 지연시간이 놀랍도록 작다. 단, 이 화면은 1개만 사용할 수 있고 실제 맥북의 화면은 까맣게 꺼지기 때문에 함께 사용할 수 있는 것도 아니다. 비전 프로 제어판을 이용해 맥 데스크톱도 같은 방식으로 사용할 수 있다. 이런 방식 때문에 이 기능은 더 큰 화면이 필요하지만 공간이 없는 상황에서만 유용하다. 그래서 비전 프로가 아니라 보조 모니터를 하나 더 구매해 사용하는 것이 더 빠르고 선명하다. 거의 모든 면에서 더 합리적인 선택이다. 더구나 오디오 문제도 있다. 어떤 이유인지는 모르겠지만 소리가 비전 프로 스피커가 아닌 맥에서만 재생됐다. 이 방식으로 맥을 사용하면, 맥 화면 좌우로 비전OS 앱 혹은 아이패드 앱을 추가해 동시에 쓸 수 있다. 맥 화면의 작업에 집중하면서 왼쪽에는 노트 앱 창을, 오른쪽엔 사파리 창을 띄어 놓고, 약간 먼 곳에는 스트리밍 영상 재생 화면을 배치하거나 애플 뮤직을 틀어놓는 식이다. 이들 창 중 하나를 응시한 후 유니버설 컨트롤 기능을 통해 맥의 키보드와 트랙패드로 해당 앱을 제어하거나 필요한 내용을 입력할 수 있다. 이런 방식은 마치 마법 같아서 처음에는 생산성이 크게 개선될 것처럼 느껴진다. 마우스가 비전 프로에서는 작동하지 않고, 맥과 연결된 마우스조차 맥 디스플레이 창에서만 작동하는 단점이 있지만 이것도 신경 쓰이지 않을 정도다. 하지만 작업을 계속 하다보면 맥 버전보다 더 낮은 버전의 비전 프로 앱을 사용하려고 이리저리 머리를 돌려야 하고 이 과정에서 오히려 떠다니는 창들이 서로 방해가 된다는 사실을 깨닫게 된다. 몇 가지 예외가 있기는 하지만 비전 프로용 앱을 실행하는 것보다는 맥에서 새 창을 여는 것이 더 빠르고 사용하기도 쉽다. 예를 들어, 필자는 이 리뷰를 작성하면서 맥북 가상 화면에 노트 앱을 띄워 놓았다. 가상 맥북 화면 왼쪽에는 떠다니는 비전OS 사파리 창을 배치하고 점심으로 먹을 윙을 주문하려 했다. 사이트를 찾아 주문하는 것이 가능했고 주소가 자동으로 완성되고 애플 페이 결제도 할 수 있었다. 비전OS 키보드로 신용카드 번호를 입력할 필요는 없는 것이 다행이었다. 하지만 실제 커서와 키보드를 이용했다면 어땠을까? 전체 주문 과정이 훨씬 더 빠르게 편했을 것이 분명하다. 비전OS에서 응시하고 꼬집는 방식으로 주문하는 것과 비교하면, 맥에서 브라우저 탭을 새로 열어 주문하는 데는 절반 시간이면 충분했을 것이다. 더구나 맥에서는 사파리 이외에 원하는 브라우저를 골라 사용할 수 있다. 애플 비전 프로의 경험이라는 것이 대부분 이런 식이다. 처음 몇 번은 너무 신기해서 이것이 얼마나 비효율적인지를 잊는다. 하지만 시간이 지날수록 아이폰이나 맥에서 같은 작업을 더 빠르고 쉽게 할 수 있다는 사실을 깨닫는다. 비전OS 기능이 앱이 개선된다면 상황이 달라지겠지만, 적어도 아직은 아니다. 단절된 미디어 경험 비전 프로 앱 경험 중 사용자를 절대 실망시키지 않으리라 확신할 수 있는 것이 바로 미디어다. 인상적인 내장 스피커와 공간 오디오, 훌륭하고 선명한 디스플레이, 마법 같은 머리와 손 트래킹 기능 덕분에 영상을 보는 것이 너무나 즐겁다. 애플 TV+나 디즈니+를 이용하든 혹은 브라우저에서 넷플릭스를 보든(현재는 비전 프로용 넷플릭스 앱이 없다) 상관없이 비전 프로는 2D 콘텐츠를 즐기기에 더할 나위 없는 기기다. 화면이 밝고 선명한 것은 물론 색감, 대비 모두 훌륭하다. 심지어 일부 앱은 영상을 볼 때 전용 가상 환경을 제공한다. 디즈니 엘 캐피탄 극장(Disney El Capitan Theatre), 영화 스타워즈의 무대인 타투인(Tatooine) 행성의 사막이 대표적이다. 3D로 만들어진 영화는 더 좋을 수 없을 정도다. 비전 프로를 착용하고 아바타 최신편이나 가디언즈 오브 갤럭시 3D 같은 영화를 보면 극장 이상의 만족감을 준다. 애플이 TV 앱을 통해 지원하는 180도 3D 비디오 '공간' 영상도 빼놓을 수 없다. 몰입적인 공룡 영상, 눈앞에서 보는 코뿔소 등이 있고 특히 얼리샤 키스가 피아노를 치며 노래 부르는 영상에서는 그의 피아노 바로 옆에 서서 음악을 감상할 수 있다. 하나하나가 모두 놀라운 경험이다. 현재 이런 기술과 영상은 이미 상용화돼 있다. 유튜브, 데오VR(DeoVR) 같은 사이트에 수많은 180도, 360도 영상이 올라와 있다. 하지만 웹에서 이들 영상을 보는 것은 제대로된 경험을 제공하지 못하고 애플이 웹XR(WebXR) 표준을 제대로 지원해야 비전 프로에서 즐길 수 있을 것으로 보인다. 문 스페이셜 플레이어(Moon Spatial Player), 리얼리티 플레이어(Reality Player) 같은 독립적인 동영상 재생기가 있지만, 아직은 완성도가 떨어지고 버그도 많다. 미디어 경험 관련해서 필자가 가장 중요하게 생각하는 것은 이런 경험이 '얼마나 고립돼 있는가'다. 혼자 미디어를 즐기고 싶을 때도 없는 것은 아니지만 많은 경우 TV나 영화를 보는 것은 다른 사람과 연관된 매우 사회적인 경험이다. 필자가 디즈니 극장을 아내에게 보여줬을 때 그의 첫마디는 "비전 프로로 영상을 보면서 고개를 돌려 바로 당신을 볼 수 있다면 멋지지 않을까?"라는 것이었다. 수백 km 떨어져 있어도 바로 옆에 앉아서 같이 영화를 보는 것 같은 느낌이 들 수 있다는 것이다. 이는 비전 프로로만 할 수 있는 완벽한 경험의 대표적인 사례가 될 수 있다. 아직 실제 구현되지는 않았지만, 애플은 이미 페르소나, 셰어플레이, 공간 오디오 등 관련 기술을 모두 갖고 있고 이를 잘 연결하기만 하면 된다. 실제로 애플은 비전 프로에서만 가능한 경험을 제공하는 데 개발 우선순위를 둘 필요가 있다. 가상 환경에서 영상을 보는 것은 이미 많은 다른 VR 헤드셋이 지난 수년간 지원해 온 기능이므로 차별화가 필요하다. 비전 프로나 아이폰 15 프로를 이용해 촬영한 공간 영상은 놀랄 만큼 멋지다. 마치 과거의 어느 순간을 실시간으로 재구성해 내가 다시 들어가는 듯한 느낌이다. 몇번 사용해 보니 1.2~2.4m 거리에서 가장 좋은 영상을 얻을 수 있고, 카메라가 흔들리지 않아야 한다는 몇 가지 제약이 있기는 하다. 하지만 평면 영상 대비 추억을 다시 떠올리는 훨씬 더 좋은 방식인 것은 분명하다. 약간 이상하게 들릴수도 있지만, 공간 영상이야 말로 비전 프로의 '킬러 기능'에 가장 가깝다. 천장을 뚫어버린 가격 보통 가격을 기준으로 제품을 리뷰하지는 않지만, 비용은 언제나 고려 대상 중 하나이고 특히 애플 비전 프로에서는 이 이야기를 빼놓을 수 없다. 가격 자체가 미친듯이 비싸기 때문만이 아니다. 가격에 이 제품의 모든 요소가 다 반영돼 있기 때문이다. 일부에서는 헤드셋 자체만으로도 3,499달러 가치를 준다고 주장한다. 메타 퀘스트 3보다 7배나 비싸지만, 수준이 다른 디스플레이와, 손과 눈 추적, 질적으로 다른 고품질 경험을 제공한다는 고려하면 일리가 있기는 하다. '어느 정도'는 말이다. 하지만 비전 프로와 관련된 다른 제품 가격을 보면 고개를 갸웃할 수밖에 없다. 제품 종류와 관계 없이 대부분 199달러로 일괄 책정했다. 예를 들어 휴대용 케이스는 149달러도 비싸게 느껴질 정도인데, 무려 199달러다. 추가 배터리는 69달러짜리 보조 배터리보다 기능도 용량도 적은데도 역시 199달러다. 일부 폼과 천, 자석으로 만든 라이트 씰 역시 '애플식' 가격표가 붙었다. 199달러다. 그나마 추가 싱글 혹은 더블 밴드는 99달러인데, 적절한 가격대보다 2배는 더 비싼 느낌이다. 최대한 많은 이윤을 남기려고 하는 가격 정책처럼 보이는 이유다. 비전 프로 본체와 주변기기 가격이 이렇다보니 앱 개발 업체도 비슷한 생각을 하는 것 같다. 비전 프로에 4,000달러 가까이 쓰는 사람이라면, 앱에도 돈을 물 쓰듯 할 것이라고 가정하는 듯하다. 주노(Juno) 앱이 대표적이다. 비전 프로용 유튜브 앱이 없는 상황에서 주노는 유튜브 API를 일종의 래핑한 앱이다. 비싸야 1.99달러면 충분할 텐데 무려 4.99달러다. 다른 앱도 비슷하다. 크로톤(Crouton) 같은 요리 앱처럼 비싼 요금으로 구독하지 않으면 사실상 비전 프로에서는 쓸모 없는 앱도 많다. 아이러니한 것은 비전 프로용 앱을 내놓은 크로톤이 비전 프로를 착용한 상태에서는 요리하지 말라고 강력하게 경고한다는 사실이다. 이런 식이라면 공간 컴퓨팅이 우리가 언젠가 마주하게 될 미래라고 확언하기 힘들다. 오히려 아무 생각 없이 앱 구독에 많은 돈을 쓰는 일부 부자들의 장난감에 더 가깝고, 신기술의 대중화와도 거리가 멀다. 필자가 더 합리적인 가격의 공간 컴퓨팅 기기는 물론, 더 합리적인 비용의 공간 컴퓨팅 생태계를 구축할 필요가 있다고 느끼는 이유다. 개선해야 할 부분 비전 프로에서 개선돼야 할 점을 정리하자. 가격은 시작일 뿐이다. 비전 프로가 더 대중화되려면 애플이 풀어야 할 숙제가 많다. 비전OS 문제부터 보자. 앞서 언급한 것처럼 앱을 주변 환경이 아니라 사용자에게 고정할 수 있어야 한다. 사용자의 시각 내에 헤드업디스플레이(HUD) 위젯을 두는 형식이 될 수도 있다. 또한 전체적으로 단절된 경험 대신 더 사회적인 부분이 반영돼야 한다. 몰입적인 셰어플레이 영상 감상, 페르소나 개선, 진정한 서드파티 공간 소셜 미디어 등이 대표적이다. 창 관리와 텍스트 입력도 보완해야 한다. 더 다양한 제스처와 멀티터치가 필요하다. 나의 찾기와 날씨, 계산기를 비롯해 비전OS가 현재는 지원하지 않는 앱을 추가해야 하고 아이패드 앱의 진정한 공간 버전을 내놓아야 한다. 이런 문제 중 일부는 하드웨어 개선 없이는 해결할 수 없다. 예를 들어 비전 프로의 시야각은 너무 좁아서 마치 스쿠버 마스크를 쓰고 세상을 보는 것처럼 시야 바깥 부분에 검은 테두리 확연하게 보인다. 애플은 시야각 사양을 공식적으로 밝히지 않았지만 100도 정도인 것으로 보인다. 무게도 1/3 정도 줄여야 하고 패스스루는 특히 밝기를 개선할 필요가 있다. 이런 부분은 하드웨어 자체를 업그레이드해야 해결할 수 있다. 현재 비전 프로는 기본적으로 집 혹은 사무실 내에서 사용하도록 만들어졌다. 셀룰러 연결을 지원하지 않고 앱이 사용자를 따라다니게 하거나 움직이는 사물에 앱을 고정할 수 없다. 혹시라도 소셜 미디어에 비전 프로를 밖에서 사용하는 것처럼 연기하는 누군가를 본다면 그들이 누리는 실제 경험은 생각하는 것과 다를 수 있음을 알아야 한다. 또한, 배터리 팩에 사용한 USB-C 포트는 전원과 데이터 용도로 모두 사용할 수 있어야 한다. 그래야 물리적인 보안 키, 마이크와 오디오 인터페이스, HDMI 입력(어댑터 포함), 외장 스토리지는 물론 여러 가지 유용한 기능을 활용할 수 있다. 존재 이유 증명은 여전히 숙제 애플 비전 프로는 너무나 흥미로운 제품이어서 하루 종일 떠들 수 있을 정도다. 애플의 최신 제품이면서 동시에 (인플레이션을 감안하면) 오리지널 맥 출시 이후 애플이 내놓은 가장 비싼 제품이기도 하다. 완전히 새로운 상호작용으로 조작하는 기기이자, 사회적 관습을 시험하는 기기이고 동시에 법적, 규제적 문제에 대한 논쟁도 촉발시키고 있다. 그렇다면 이 1세대 제품은 구매할 만한 가치가 있을까? 필자가 비전 프로를 사용해 본 후 내린 최종 결론은 적어도 당장은 추천하기 힘들다는 것이다. 이런 결론의 이유는 당연히 가격이다. 다른 애플의 1세대 제품은 경쟁 제품보다 크게 비싸지 않았는데 비전 프로는 타의 추종이 불가능할 정도의 가격이다. 하지만 그보다 더 큰 이유는 애플 비전 프로가 스스로 존재 증명을 하지 못하고 있다는 점이다. 현재 비전 프로로 할 수 있는 모든 작업은 다른 방식으로 더 쉽고 빠르고 저렴하게 처리할 수 있다. 지금 비전 프로에는 비전 프로만의 '킬러 앱'이 절실하게 필요하다. '공간 컴퓨팅'이 아니면 할 수 없는 것을 찾아야 한다. 집 주변에 배치한 떠다니는 아이패드 앱 창은 비전 프로의 존재 증명으로 턱없이 부족하다. 비전 프로라는 기기와 더 일반적인 의미의 공간 컴퓨팅에 커다란 잠재력이 있음은 부인할 수 없다. 하지만 필자가 리뷰하는 것은 가능성이 아니라 제품이다. 개념이 아닌 애플 비전 프로 제품은 너무 한계가 뚜렷하고 너무 단절돼 있다. 생산성 기기로든, 엔터테인먼트 기기로든 큰 비용을 치르고 이 공간 컴퓨팅 대열에 선뜻 뛰어들기에는 활용성이 너무 떨어진다. 이런 문제 중 일부는 비전OS와 앱 측면에서 더 완성도 높은 소프트웨어를 통해 해결할 수 있다. 하지만 일부는 더 개선된 하드웨어 없이는 불가능하다. '골수' 애플 얼리 어답터조차 소프트웨어가 개선될 때까지 구매를 보류하라고 말하는 이유다. 필자가 일반적인 사용자에게 할 수 있는 최종 조언은 하드웨어까지 개선된 '2세대 제품'을 기다리라는 것이다. editor@itworld.co.kr
애플 비전 프로(Apple Vision Pro)의 출시는 애플에 있어 중요한 분수령이 될 것이다. 천정부지로 치솟은 가격과 한정된 수량으로 인해 지금 당장은 아이폰만 한 영향력을 발휘하지 못하겠지만, 애플은 이 제품이 미래라는 것을 분명히 알고 있다. 공간 컴퓨팅은 애플의 미래일 뿐 아니라 모든 컴퓨팅의 미래라고 할 수 있다. 애플은 사용자가 주변 공간에서 가상의 사물과 상호작용하고 가상의 객체가 실제 사물 및 공간과 상호작용하는 공간 컴퓨팅을 차세대 컴퓨팅으로 내세우고 있다. 애플의 첫 번째 공간 컴퓨팅 제품이자 많은 관심과 주목을 받고 있는 제품인 만큼, Macworld는 결론을 내리기 전에 제품을 천천히 검토하는 중이다. 리뷰를 시작한 지 며칠이 지나지 않았지만, 벌써 많은 생각이 떠올랐다. 여기서는 애플 비전 프로의 심층 리뷰 기사를 준비하면서 작성한 메모와 아이디어, 관찰 사항을 일종의 학습 일지 형식으로 정리했다. '미래에서 온' 메모 애플은 애플 비전 프로를 'VR 헤드셋'이라고 부르는 것을 바라지 않지만, 이 제품은 VR 헤드셋이 맞다. 메타 퀘스트 3 같은 다른 제품보다 증강 현실을 위한 패스스루 비디오의 품질이 좋다. 상호작용 모델은 서로 다르지만 훌륭한 패스스루 비디오, 시선 추적 기능을 제공하고 여러 멋진 센서가 탑재된 VR 기기다. 플라스틱에 대한 애플의 병적인 혐오감은 문제다. 애플 비전 프로에 사용된 모든 금속과 유리가 너무 무겁다. 무게뿐 아니라 모든 무게가 얼굴 앞쪽에 집중돼 분산되지 않는 것도 문제다. 적어도 200g은 더 가벼워야 할 듯하다. 어떤 기능은 미쳤다고 할 정도로 한 차원 높은 수준인 반면, 어떤 기능은 이상하리만치 시대에 뒤떨어지고 단순하게 느껴진다. 일반 사용자용 기기에서 시선 추적 기능을 이보다 더 잘 구현하는 제품은 없다. 시선 추적은 마법과도 같다. 하지만 앱 관리가 엉망이다. 이동시킬 수 없는 동그란 아이콘이 알파벳 순서로 벌집 모양으로 배열되어 있다니. 앱 스토어는 너무 기본적이어서 적절한 카테고리와 목록이 필요하다. 이 3,500달러짜리 공간 컴퓨터에 어린이 장난감처럼 생긴 키보드가 웬 말인가. 애플 비전 프로는 나의 찾기를 지원하지 않는다. 정밀한 찾기 기능은 증강 현실과 자연스럽게 어울릴 것 같은데, 나의 찾기 앱도 없다. 애플은 증강 현실을 통해 어디에 두었는지 까먹은 에어태그나 아이폰까지 말 그대로 줄을 그려서 찾도록 할 수 있었을 것이다. 필자는 이 기기에서 '미래'를 보았다. 컴퓨팅 리소스가 실제 물체처럼 안정적이고 선명하게, 하지만 가상으로 공중에 떠 있거나 벽에 걸려있다. 이 제품은 이런 미래적인 요소를 실제로 구현한 최초의 제품이다. 창을 어디에 두어야 할까? 떠 있는 창으로 인해 주변 공간이 금방 부족해졌다. 생산성을 높이려면 많이 돌아다니고 움직여야 한다. 비전 프로에는 창 관리 도구가 절실히 필요하다. 여러 면에서 맥 데스크톱에서 멀티태스킹하는 것이 더 빠르고 쉽다. 일부 앱은 업데이트가 시급하다. 어떤 앱은 제대로 작동하지 않고, 어떤 앱은 매우 초라해 보인다. 맥북 데스크톱에서 다른 창을 열거나 데스크톱 '공간'을 새로 만드는 것보다 더 나은 생산성 앱을 아직 찾지 못했다. 가상 모니터로 맥북 작업을 하는 동안 옆에 있는 사파리 공간 창을 열고 점심 메뉴로 치킨을 주문했다. 잘 작동했고, 애플이 이 모든 자동 완성 데이터를 보유하고 있어 많은 도움이 됐다. 그러나 메뉴 탐색과 항목 선택은 맥을 사용한 경험보다 느리고 어색했다. 오히려 생산성을 떨어뜨리는 결과를 낳기도 했다. 가상 객체와 창이 매우 잘 어우러진다. 정말 견고하고 안정적이며, 실제 창처럼 보인다. 안타깝게도 애플 비전 프로를 착용한 채로 커피를 마실 수 없다. 헤드셋이 머그잔과 충돌한다. 빨대나 코끝을 넘지 않을 정도로 입구가 좁은 보온병을 사용해야 한다. 이런 종류의 제품이 몇 시간 동안 업무를 해야 하는 일반 사용자에게는 아직 적합하지 않다는 것을 보여주는 예다. 가장 불만스러운 점은 제어 센터다. 점을 보고 선택하면 되지만, 앱과 몰입형 환경을 사용할 때 실수로 제어 센터를 계속 실행하게 된다. 하루에도 수십 번씩 이런 일이 발생했다. 녹음, 에어드롭 수신 등 무언가가 지속되면 점들이 시야에 떠다니면서 보고 있는 내용을 엉망으로 만든다. 제스처처럼 더 나은 해결책이 있을 것이다. 지금까지 본 패스스루 동영상 중에서는 단연 최고지만, 완벽하지는 않다. 아주 밝은 조명에서는 선명도가 떨어졌고 주변이 어두워지면 해상도, 노이즈, 지연 시간 및 모션 블러가 크게 증가했다. 실내에서는 모든 조명을 켜지 않으면 화면 품질이 좋지 않다. 반면 렌더링되는 그래픽의 품질은 다른 헤드셋에서는 볼 수 없었던 방식으로 선명하고 또렷하며, 밝고 섬세하다. 양옆, 혹은 위아래로 펼쳐지는 3D 동영상 라이브러리가 시중에 나와 있다. 하지만 그 어떤 것도 재생할 방법이 없었다. 맥 가상 모니터로서의 사용 경험은 훌륭하지만 약간의 지연이 있다. 일상적인 업무를 처리하는 데는 괜찮지만 게임을 플레이할 때는 거슬릴 것이다. 1패스워드(1Password)와 같은 비밀번호 관리자를 사용하고 물리적 보안 키를 설정한 경우, 아무 곳에나 연결할 수 없다는 점은 다소 문제가 될 수 있다. 기본 비밀번호 관리자 앱은 없지만 일부 아이패드 앱은 정상적으로 작동한다. 떠 있는 창과 커다란 가상 비디오 화면은 많지만, 가장 유용할 것 같은 증강 현실을 활용한 기능은 많지 않다. 여기서는 다시 한번 게임 부문이 선두를 달리고 있다. 특히 슈퍼 푸르츠 닌자(Super Fruit Ninja)는 필자가 사용해 본 그 어떤 앱보다 AR을 가장 잘 구현했고, 재미있기도 했다. editor@itworld.co.kr
마우스로 컴퓨터를 사용하기 시작한 이후 아이콘은 운영체제의 중심이었다. 폴더, 휴지통 또는 돋보기를 나타내는 작고 단순한 이미지를 클릭하면 원하는 작업을 바로 시작할 수 있다. 일반적으로 아이콘의 모양은 운영체제가 제어하며 대부분은 바꿀 이유가 없다. 예를 들어 휴지통이 갑자기 계산기처럼 보이게 한다거나 검색 도구 아이콘을 폴더로 바꿀 필요가 없다. 하지만 사용자 폴더나 바로 가기 등 아이콘 모양을 바꾸는 것이 오히려 더 편리한 경우가 있다. 또한, 아이콘이 매우 많을 경우 모두 똑같지 않다면 더 매력적이고 찾기도 쉽다. 특히 폴더 같은 경우 색깔만 달라도 찾기가 훨씬 쉽다. 애플은 이 점을 깨달았고 맥에서는 폴더의 색상을 쉽게 변경할 수 있다. 윈도우에서는 이보다 조금 더 복잡하면 역시 바꿀 수 있다. 물론 색상을 바꾸는 데 만족할 필요도 없다. 아이콘의 모양을 자유롭게 선택할 수 있다. 예를 들어, 승마 관련된 문서가 있는 폴더라면 노란색 폴더 아이콘을 말 그림으로 바꿀 수 있다. 자주 방문하는 웹 페이지의 바로 가기에 해당 사이트의 로고를 넣는 것도 좋다. 방법은 무궁무진하지만 한 가지 명심해야 할 중요한 사항이 있다. 이미지 폴더의 아이콘을 변경하면 미리보기 기능이 사라진다. 일반 기본 아이콘을 사용하면 폴더 콘텐츠의 썸네일을 볼 수 있지만 아이콘을 변경하면 이 기능을 더는 사용할 수 없다. 아이콘을 바꾸는 단계별 방법 1. 설정 열기 사용하려는 폴더 또는 파일을 마우스 오른쪽 버튼 클릭하고 속성을 선택한다. 폴더인 경우 사용자 지정 탭을 선택하고 바로 가기인 경우에는 바로 가기라는 탭을 클릭한다. 어느 쪽이든 아이콘 변경이라는 옵션이 표시된다. 2. 기본 아이콘으로 변경하기 이제 시스템에 내장된 기본 아이콘이 표시되며, 변경하려는 아이콘은 변경하려는 항목에 따라 달라진다. 사용하려는 아이콘을 찾아 클릭한 다음 확인을 선택한다. 확인을 한 번 더 눌러 최종 선택한다. 3. 나만의 아이콘 사용하기 기본 제공 아이콘이 마음에 들지 않으면 일명 'ico' 파일을 사용할 수 있다. 온라인에서 다운로드할 수 있는 사이트가 많이 있으며 그중 가장 좋은 사이트가 아이콘파인더(Iconfinder)다. 으로 이동해 아이콘을 클릭한다. 4. 아이콘 검색 아이콘파인더에는 600만 개 아이콘이 등록돼 있다. 카테고리를 검색하거나 탐색해 원하는 아이콘을 찾을 수 있다. 일부 아이콘은 유료지만 검색할 때 무료를 선택하면 무료 아이콘만 볼 수 있다. 5. 아이콘 다운로드 마음에 드는 아이콘을 찾으면 저장하면 된다. 단, ico 형식을 선택하는 것이 중요하다. 기타 > ICO를 클릭한 다음 'ICO로 다운로드'를 선택한다. 이 파일을 사용해야 하므로 쉽게 찾을 수 있는 폴더에 저장하는 것이 좋다. 6. 아이콘 변경하기 이제 다시 아이콘 속성을 열고 변경 아이콘을 누른다. 찾아보기를 선택하고 ico 파일을 찾는다. 열기를 누르면 아이콘의 썸네일이 나타난다. 아이콘이 강조 표시됐는지 확인하고 확인을 두 번 누른다. 이제 이전 아이콘이 새 아이콘으로 바뀐 것을 확인할 수 있다. 7. 선택적으로 이미지 변경하기 기존 아이콘이 마음에 들지 않으면 직접 만들 수 있다. 기존 이미지를 가져와서 ico 형식으로 변환하면 된다. 와 같이 무료로 이 작업을 할 수 있는 웹사이트도 있다. 8. 처음부터 새로 만드는 것도 가능 같은 웹 서비스를 사용해도 좋다. 이것은 윈도우 아이콘을 만들기 위한 간단한 웹 기반 그리기 프로그램이다. 마우스로 그리거나 하드 드라이브에서 이미지 파일을 가져와서 만들 수 있다. 결과가 만족스러우면 다운로드를 클릭해 이미지를 아이콘 파일로 저장한다. 파비콘은 디자인 측면에서 약간 오래된 서비스지만, 잘 작동한다. editor@itworld.co.kr
랜섬웨어는 재해복구 계획을 뒷방에서 전면으로 끌어올렸다. 허리케인, 토네이도, 지진의 피해를 입지 않을 것이라 생각하는 것은 이해할 수 있다. 하지만 기업이 랜섬웨어의 공격을 받지 않을 것이라 생각하는 것은 복권에 당첨될 것이라 생각하는 것과 같다. 기업이 랜섬웨어의 공격을 받을 확률은 매우 높기 때문에 사고 대응 계획에 포함된 견고한 재해 복구 계획이 필요하다. 수십 년간 이 업계에서 일하면서 배운 것이 있다면, 백업이나 복제본만 있다고 해서 진정한 의미의 재해 복구 계획이 수립된 것은 아니라는 것이다. 필자는 중요한 시스템 복구를 직접 겪었고, 추측만 하고 계획이 불완전할 때 어떤 일이 벌어지는지 목격했다. 특히 오늘날과 같이 랜섬웨어가 만연한 환경에서는 복구 준비는 타협할 수 없다. 복구 인프라의 사전 정의 적절한 DR 계획은 완전히 새로운 인프라에서 데이터와 시스템을 복원해야 한다는 가정을 바탕으로 수립된다. 포렌식 상의 이유로 원래 시스템을 보존해야 하거나 하드웨어가 수리가 불가능해 사용할 수 없을 수도 있다. 공격이나 재해가 발생한 후 동일한 물리 서버를 재사용하는 것은 무모한 일이다. 불가능할 수도 있으므로 완전히 새로운 하드웨어로 복구를 시작할 준비가 되어 있어야 한다. 즉, 이벤트 발생 후 임시 배포를 위해 대기 장비 또는 장애 조치 호스트를 미리 확보해야 한다. 클라우드 인프라를 활용하는 것은 이를 위한 좋은 방법 중 하나인데, 구성을 미리 만들어 두고 필요할 때 비용을 지불하면 되기 때문이다. 혼란스러운 상황에서 교체 서버를 구입하기 위해 허둥대는 것은 위기를 더욱 키울 뿐이다. 따라서 교체 시스템이 실제로 필요하기 훨씬 전에 대체 시스템을 어디에서 가져올지 알고 있어야 한다. 페일오버 환경의 신속한 보호 사람들이 간과하는 또 하나는 페일오버가 발생한 후 DR 사이트를 백업하는 방법이다. 온프레미스든 클라우드든 DR 사이트로의 전환이 발생하면 새로운 환경에 대한 백업을 즉시 시작해야 한다. 중요한 시스템을 성공적으로 복구했는데, 백업 생성을 소홀히 해 2차 랜섬웨어가 DR 사이트까지 위험에 빠뜨리는 것은 누구도 원치 않을 것이다. 복구 하드웨어 구입 계획과 마찬가지로, 복구 사이트 역시 백업할 방법을 미리 결정하고 설계해야 한다. 또한, 복구 사이트에 장애가 발생하면 자동으로 백업이 시작되도록 설계하는 것이 가장 좋다. 레거시 백업이 다시 설정될 때까지 복구가 완료된 것으로 간주해서는 안된다. 가시적인 복구 기간 목표 정의 일반적인 비즈니스 책임자에게 어떤 종류의 복구 요구 사항이 있는지 물어보면 데이터 손실이 전혀 없는 즉각적인 복구(즉, RPO와 RTO가 0인 복구)가 필요하다고 말할 것이다. 하지만 이런 요구 사항을 충족하는 데는 천문학적인 비용이 든다. 따라서 어렵겠지만, 재해가 발생하기 전에 현실적인 복구 시간과 데이터 손실 허용 임계치에 대해 논의를 마쳐야 한다. 조직의 우선순위를 조정하고 비즈니스 연속성 요구 사항과 실제 IT의 역량 및 비용 제약의 균형을 맞추기 위해 경영진의 이해관계자와 더 많이 논의할수록 복구가 더 성공적으로 이루어질 수 있다. '성공'은 상대적인 개념이므로 비즈니스에서 설정한 목표를 달성해야만 성공할 수 있다는 점을 기억하자. 이런 목표가 현실적이고 적절한 자금이 뒷받침된다면 성공으로 가는 길에 들어선 것이다. 의심 극복을 위한 문서화 및 테스트 목표가 정의되어 있더라도, 치열한 전투 상황에서는 문서화되고 입증된 실행 지침이 필수적이다. 데이터와 시스템을 대규모로 효율적으로 복원하는 방법을 이해하지 못하면, 단순히 백업 복사본이나 복제본을 보유하는 것만으로는 아무 소용이 없다. 시스템 종속성을 포함해 중요도 순으로 자산을 복구하는 단계별 절차가 필요하다. 또한 문서에는 복구 환경의 전체 인벤토리, 모든 직원 및 공급업체의 연락처 목록, 문제 처리를 위한 단계별 프로세스가 포함돼야 한다. 모의 시나리오에서 중요하고 반복적인 테스트를 하면, 가장 중요한 순간에 담당자가 이 문서를 활용해 가치를 실현하는 연습을 할 수 있다. 자동화보다 중요한 걸음마 단계 초기 DR 작업은 수동 절차가 주를 이룰 수 있지만, 자동화를 지속적으로 추진해야 한다. 프로그래밍 방식으로 스크립팅하거나 트리거할 수 있는 복구 작업이 많을수록 성공 확률이 높아진다. 하지만 최고만을 추구하면 오히려 독이 될 수 있다. 완전한 자동화를 추구하느라 초기 단계의 DR 계획 수립이 늦어져서는 안 된다. 아무것도 없는 것보다는 무엇이라도 있는 것이 낫다. 먼저 모든 것을 문서화한 다음 테스트 피드백을 바탕으로 시간이 지남에 따라 선별적으로 자동화를 추진하기 바란다. 마라톤의 결과보다 중요한 것은 걸음마 단계이다. 클라우드 활용 클라우드는 데이터 복제, 특히 임시 DR 인프라를 프로비저닝하는 데 높은 유연성을 제공한다. 클라우드 서비스를 사용하면 테스트 환경을 편리하게 가동 및 중단할 수 있어 재해 시나리오를 훨씬 쉽게 연습할 수 있다. 온프레미스 인프라를 사용하는 기업의 경우에도 DR 목적으로 클라우드 기반 백업 복제를 고려하기 바란다. 대부분의 경우, 클라우드는 이미 사이버 복원력 준비에 있어 중요한 역할을 하고 있으므로 재해 대비에도 클라우드를 적용하는 것이 좋다. 허점이 드러날 때까지 테스트 DR 문서가 있는 것은 좋지만 필요할 때만 테스트하는 것은 좋지 않다. 테스트의 또 다른 목적은 근육 기억을 개발하는 데 도움이 되는 것 외에도 프로세스의 부족한 부분을 찾아내는 것이다. 모의 재난을 통해 선제적으로 실패를 경험해 보는 것이다. 새로운 기능이나 절차를 검토할 때 때때로 발생하는 장애를 예상할 수도 있다. 29년 전, 딸이 막 태어났을 때 아내의 병실에서 전화가 걸려와 복구 작업을 도와달라는 요청을 받은 적이 있다. 문서화된 프로세스가 있었기 때문에 전화를 끊고 새 아이에게 집중할 수 있었다. 문서화된 복구 프로세스가 언제 필요할지는다. 하지만 지금이 바로 프로세스를 시작할 때다. editor@itworld.co.kr
LLM(Large Language Model)을 사용하는 방법은 의외로 간단하다. 효과적인 프롬프트만 있으면 된다. 반면 언어 모델을 기반으로 한 애플리케이션 개발은 어려울 수 있다. 오픈AI 같은 업체에서 제공하는 API를 사용하든, 오픈소스 모델을 앱에 임베딩하든 프롬프트 작성 이상의 작업을 수반한다. 매개변수 조정부터 응답 조정에 이르기까지 개발자가 고려해야 할 요소는 많으며, 여러 가지 LLM을 다뤄야 할 경우 복잡성은 배가 된다. 이때 사용하면 좋은 도구가 바로 랭체인(LangChain)이다. 랭체인은 언어 모델 기반 애플리케이션 개발을 간소화하는 파이썬 및 자바스크립트용 모듈식 프레임워크다. 여기서는 랭체인의 작동 방식과 설치 및 사용법을 알아보고, 랭스미스를 활용해 랭체인으로 개발한 LLM 앱과 에이전트를 추적 및 평가하는 방법을 정리한다. 주요 내용 - “LLM 개발을 더 간편하게” 랭체인의 개념과 이해 - “다양한 모델을 체인으로 연결한다” 예제로 시작하는 랭체인 - 구글 PaLM 2 API와 랭체인을 함께 사용하는 방법 - 랭체인과 구글 PaLM 2를 사용한 Q&A 앱 만들기 - LLM용 추적 및 디버깅 도구 ‘랭스미스’ 따라잡기
핸드폰이 생긴 이래로 우리는 종종 핸드폰을 물속에 빠뜨리곤 한다. 오늘날 아이폰은 물방울이나 침수에 강하지만, 너무 많이 젖어 커넥터 내부에 액체가 있으면 액체 감지 경고가 표시되는 경우가 있다. 아이폰이 침수됐을 때 복구 방법으로 '쌀 한 봉지'에 아이폰을 넣는 방법이 민간 요법으로 회자되곤 한다. 휴대폰을 쌀이 담긴 봉투에 넣고 밀봉한 후 하루 정도 기다리면 물기가 전자 부품에 닿아 손상을 입히기 전에 쌀이 휴대폰 내부의 물기를 흡수한다는 개념이다. 물에 휴대폰을 빠뜨린 경험이 있는 사람들은 이런 방법을 신뢰하고 있으며, 실제로 효과가 있다는 주장도 있다. 하지만 여러 핸드폰 수리 전문가는 그동안 쌀 봉투를 이용하는 방법이 일종의 미신에 가까우며, 휴대폰을 더 빨리 말리지 않고 오히려 휴대폰 건조 시간을 늦추어 메인보드가 손상되기 쉽게 만든다고 주장한다. 심지어 애플은 최근 업데이트한 에서 이런 방법을 권장하지 않는다고 못을 박았다. 애플은 "그렇게 하면 작은 쌀 알갱이가 아이폰을 손상시킬 수 있기 때문"이라고 설명했다. 휴대폰이 침수됐을 경우 애플은 다음과 같은 단계를 따를 것을 제안했다. 커넥터가 아래를 향하도록 든 상태에서 아이폰을 손으로 가볍게 두드려 액체를 제거한 후, 아이폰을 공기가 약간 통하는 건조한 곳에 둔다. 최소 30분 후 라이트닝 또는 USC-C 케이블로 충전하거나 액세서리를 연결해 본다. 침수 경고가 여전히 표시되면 커넥터나 케이블 핀 아래에 액체가 남아 있는 것이다. 최대 하루 동안 아이폰을 바람이 잘 통하는 건조한 곳에 둔다. 그동안 충전 또는 액세서리 연결을 다시 시도해보면 된다. 완전히 마르는 데는 최대 24시간이 걸릴 수 있다. 휴대폰이 충분히 말랐지만 여전히 충전되지 않는다면, 케이블을 어댑터에서 분리하고 가급적 어뎁터도 벽에서 분리한 다음 다시 시도한다. 애플에 따르면, 외부 열원이나 압축 공기로 아이폰을 말리거나 면봉이나 종이 타월 같은 '이물질'을 라이트닝 또는 USB-C 포트에 삽입하는 행위는 하지 않도록 주의해야 한다. 아이폰 12부터는 최대 수심 6미터의 물에서 최대 30분까지 버틸 수 있으므로 액체로 인한 손상은 걱정하지 않아도 되지만, 혹시라도 물에 빠뜨리게 된다면 쌀은 그냥 보관함에 넣어 두도록 하자. editor@itworld.co.kr
충전 케이블을 전원에 연결했는데도 노트북이 충전되지 않는 것보다 더 짜증스러운 일은 없다. 특히 케이블 관리에 서투른 사람이라면 자주 겪는 일이다. 그렇다면 노트북이 충전 문제를 겪을 때 어떻게 대처해야 할까? 노트북의 충전 문제 종류와 각 해결법을 알아보자. 케이블 재점검 때로는 눈앞에 답이 있다. 문제 해결에 돌입하기 전에 먼저 충전 케이블이 멀티탭이나 벽면 콘센트에 제대로 꽂혀 있는지 확인해야 한다. 다른 콘센트로 옮겨 케이블을 연결해 본다. 모든 케이블이 노트북에 제대로 결합되어 있는지 살펴본다. 올바른 충전기나 포트를 사용하고 있는가 노트북을 가끔 사용하거나 테스트처럼 기종이 자주 바뀌는 경우에는 충전 케이블을 엉뚱한 포트에 꽂는 실수가 발생할 수도 있다. 충전용 포트가 따로 정해져 있는 제품이 많이 출시돼 있고, 충전 전용 포트 옆에 작은 전원 아이콘이 보통 표시돼 있다. 충전 포트를 식별할 수 없다면 올바른 포트를 찾을 때까지 케이블을 여러 포트에 바꿔 꽂아 보자. 노트북에 포함돼 있는 충전기를 사용할 것을 권장한다. 꼭 필요한 경우 서드파티 충전기도 괜찮겠지만 기기에 적합한 와트가 아니라면 배터리가 손상된다. 서드파티 충전기의 와트가 낮으면 충전 속도가 한없이 느려진다. 노트북 같이 소비 전력이 큰 제품용으로 설계되지 않은 충전기도 있다. 케이블이나 포트의 손상 확인 충전 케이블에 흠집이 없는지 꼼꼼히 살펴보자. 오래 쓴 케이블이라면 와이어 일부가 빠지거나 닳은 경우가 있다. 물론 피복이 닳거나 해진 부분을 전기 테이프로 감쌀 수도 있지만 우선 케이블 플러그를 뽑아 타는 냄새가 나는지 확인해야 한다. 충전 케이블의 어댑터에서 타는 냄새가 난다면 빨리 교체해야 한다. 충전 케이블이 정확히 삽입되었는지 확인할 때는 포트에 먼지나 이물질이 있는지도 검사한다. 면봉이나 이쑤시개로 조심스럽게 이물질을 제거하면 된다. 그러나 너무 거칠게 다루면 포트가 손상되고 이물질이 더 깊이 들어갈 수 있으니 주의해야 한다. 압축 공기 스프레이로 먼지를 날리는 방법도 있지만, 너무 세게 분사하거나 포트에 직접 분사해서는 안 된다. 배터리 고장 가능성 분리 가능한 노트북이라면 배터리를 분리해 보자. 하드웨어를 하드 리셋한다고 생각하면 된다. 사용 설명서를 참고해 배터리를 분리하고, 전원 버튼을 몇 초 동안 누르고 충전기를 다시 연결한다. 노트북이 켜지고 전원만으로 정상 작동한다면 배터리에 문제가 있는 것이다. 극세사 천으로 배터리 접촉면을 부드럽게 닦은 후 다시 끼워 넣고 전원을 켜 보자. 배터리가 분리되지 않는 노트북이라면 직접 배터리를 분리해서는 안 된다. 제품에 심각한 손상을 가져올 수 있다. 실행 프로그램이 너무 많은 자원을 소모한다면 내부 하드웨어와는 관련이 없는 문제일 수도 있다. 노트북에서 자원을 많이 소비하는 프로그램을 여러 개 실행한다면 배터리 효율이 떨어진다. Ctrl + Alt + Delete 단축키로 작업 관리자 앱에 액세스해 현재 실행 중인 프로그램을 확인하자. 종료하려는 프로그램을 선택하고 작업을 종료한다. editor@itworld.co.kr
데이터를 중앙집중화하지 않고 데이터가 있는 곳에서 사용하는 AI 모델은 더 강력한 개인정보보호 및 보안 조치가 필요하다. 연합 학습((Federated Learning)은 AI 학습의 협업 모델 발전에 있어서 하나의 이정표를 세웠다. 기존의 중앙집중식 훈련 방식에서 벗어나 한층 더 분산된 방식으로 머신러닝에 대한 접근 방식을 바꾸고 있다. 데이터가 흩어져 있으므로 데이터가 있는 곳에서 학습 데이터로 활용해야 한다. 이 패러다임이 완전히 새로운 것은 아니다. 1990년대에 이미 시도된 접근 방식이지만, 오래된 것이 다시 새로운 것이 되는 법이다. 연합 학습을 사용하면 여러 디바이스나 서버에서 머신러닝 모델을 공동으로 학습할 수 있으며, 데이터를 교환하거나 중앙에 모을 필요 없이 수집된 데이터를 활용할 수 있다. 연합 학습에 관심을 둬야 하는 이유는 무엇일까? 보안과 프라이버시 때문이다. 연합 학습의 핵심 원칙은 다음과 같다. 데이터의 탈중앙화. 데이터를 중앙집중화해야 하는 기존 방식과 달리 연합 학습은 데이터 소스에 모델을 분산시켜 데이터가 있는 곳에서 데이터를 사용한다. 예를 들어, 작업을 모니터링하기 위해 파쇄 로봇에 데이터를 보관하는 경우, 해당 데이터를 중앙 데이터 저장소로 옮길 필요가 없다. 로봇에서 직접 활용하면 된다. 이는 실제 사용례이다. 프라이버시. 연합 학습은 데이터가 휴대폰, 태블릿, 컴퓨터, 자동차, 스마트워치 등 사용자의 기기에 남아 있기 때문에 설계상 사용자 프라이버시가 강화된다. 이는 디바이스에서 AI 모델로 직접 연결되기 때문에 민감한 정보의 노출을 최소화한다. 협업 학습. 모델은 여러 디바이스나 서버에 있는 다양한 데이터 세트를 통해 자연스럽게 학습할 수 있다. 효율적인 데이터 활용. 연합 학습은 방대하고 분산되어 있거나 민감한 데이터가 있는 문제 영역에 특히 유용하다. 특정 데이터 세트 고유의 프라이버시 정책을 준수하면서 가용 데이터의 활용을 최적화한다. 이런 요소는 AI에 유용할 뿐만 아니라 더 나은 보안과 프라이버시를 제공한다. 또한, 같은 데이터를 서로 다른 두 곳에 저장하지 않아도 된다. RoPPFL 프레임워크 연합 학습은 데이터를 중앙집중화할 필요 없이 여러 디바이스나 서버에서 협업 모델을 학습할 수 있는 장점을 제공하지만, 여전히 보안 및 프라이버시 관련 우려는 남아 있다. 로컬 데이터 세트의 개인정보 유출 위험과 악의적인 클라이언트에 의한 AI 모델 포이즈닝 공격의 위협이 대표적이다. 이렇게 새로운 문제가 발생하면, 멋진 이름과 약어로 독보적인 솔루션이 등장할 차례이다. 여기서는 엣지 컴퓨팅 환경의 연합 학습과 관련된 문제를 해결하기 위한 솔루션인 를 소개한다. RoPPFL 프레임워크는 LDP(Local Differential Privacy, 로컬 차분 프라이버시)와 (LDP)로컬 차등 프라이버시(LDP)와 유사도 기반의 RoWA(Robust Weighted Aggregation) 기술을 결합한다. LDP는 모델 업데이트에 보정된 노이즈를 추가해 데이터 프라이버시를 보호한다. 이를 통해 공격자가 개별 데이터 포인트를 추론하는 것을 매우 어렵게 만드는데, AI 시스템에 대한 일반적인 보안 공격이다. RoWA는 모델 업데이트를 유사성에 따라 집계해 악의적인 개입의 영향을 완화함으로써 포이즈닝 공격에 대한 시스템의 복원력을 향상시킨다. RoPPFL은 계층적 연합 학습 구조를 사용하는데, 이 구조는 클라우드 서버, 엣지 브라우저, 클라이언트 디바이스 등 여러 계층에 걸쳐 모델 학습 프로세스를 구성한다. 향상된 보안과 프라이버시 RoPPFL은 항상 이런 문제를 처리해야 하는 클라우드 아키텍트에게 올바른 방향으로 나아가는 단계를 보여준다. 필자 역시 요즘 업무의 80%가 생성형 AI이기 때문에 학술용어에 가깝지만 RoPPFL을 거론하지 않을 수 없다. 이 모델은 스마트폰 및 기타 개인용 디바이스와 같은 엣지 브라우저를 데이터에 굶주린 AI 시스템의 학습 데이터 소스로 사용하는 등 보안과 프라이버시라는 두 가지 과제를 동시에 해결한다. RoPPFL 프레임워크는 AI 사용으로 인해 매우 위험에 처한 데이터 보호 및 프라이버시를 타협하지 않고도 협업 기반의 모델 훈련 패러다임을 성공적으로 운영할 수 있다. 데이터를 먹고 사는 AI 시스템을 설계, 구축, 운영하려면 더 현명한 방법을 생각해야 한다. 클라우드에 있든 없든 데이터에 해를 끼치지 않는 방식으로 AI 시스템을 구축하는 방법을 찾아야 하는 것이다. 많은 기업이 일단 생성형 AI 시스템부터 구축하고 정작 중요한 질문은 나중에 하는 현재 상황을 고려할 때, 이런 솔루션이 일반적인 관행이 될 수 있도록 구축, 배포 및 보안 방법에 대해 보다 건전한 사고가 필요하다. 현재 분산 데이터를 사용하는 AI 시스템을 구축하고 있는 많은 기업이 아직 RoPPFL에 대해 들어본 적이 없을 것이다. 하지만 이 프레임워크는 클라우드와 AI 시스템 아키텍트라면 반드시 알아야 할 현재와 미래의 많은 아이디어 중 하나이다. editor@itworld.co.kr
생성형 AI에 대한 내부 고발이 이어지고 있지만, 대부분은 우리가 이미 알고 있는 내용이다. 많은 생성형 AI 시스템에서 사용자가 요청한 것과 다르거나 명백히 잘못된 응답이 나온다는 것이다. 공개적으로 문제가 된 것은 마이크로소프트의 소프트웨어 엔지니어링 책임자인 셰인 존스가 3월 6일 FTC 위원장 리나 칸과 마이크로소프트 이사회에 마이크로소프트의 AI 이미지 생성기가 특정 메시지가 주어지면 폭력적이고 성적인 이미지를 생성하고 저작권이 있는 이미지를 사용했다는 내용의 서한을 보낸 것이다. 물론 공개적으로 액세스할 수 있는 대규모 언어 모델(LLM)이 눈총을 받고 있다. 하지만 생성형 AI를 활용하는 비즈니스 애플리케이션은 어떨까? 규모가 작을수록 더 나은 품질의 응답을 유도할 수 있을까? 그렇지 않다. 생성형 AI가 잘못되는 지점 많은 사람이 생성형 AI가 정보를 제공하고 유용한 응답을 제공할 것이라고 생각했다. 하지만 이 기술은 그 기대에 부응하지 못하고 있는 것 같다. 도대체 무슨 일이 일어나고 있는 것일까? 생성형 AI는 모든 AI 시스템과 동일한 한계를 가지고 있다. 모델 학습에 사용되는 데이터에 따라 달라진다는 것이다. 엉터리 데이터는 엉터리 AI 모델을 만든다. 틀린 응답이나 법적 문제에 휘말릴 수 있는 응답을 받을 수도 있다. 이런 시스템에 내재된 한계를 인정하고 때때로 "어리석다”라고 할 만한 결과를 낼 수 있다는 것을 이해하는 것이 중요하다. 그렇지 않으면 이런 AI 시스템의 어리석음이 회사를 망하게 하거나 송사에 휘말리게 할 수 있다. GPT와 같은 생성형 AI 모델은 방대한 데이터 세트에서 학습한 패턴과 연관성을 기반으로 작동한다. 이런 모델은 일관되고 맥락에 맞는 응답을 생성할 수 있지만, 적절한 이해와 의식이 부족해 당혹스럽거나 무의미해 보일 수 있는 결과를 내놓을 수 있다. 공개 LLM에 역사 논문을 작성하도록 요청하면, 나폴레옹이 미국 남북 전쟁에 참전했다는 설명이 나올 수도 있다. 물론, 이런 오류는 쉽게 발견할 수 있다. 하지만, 새로 만든 생성형 AI 기반 공급망 최적화 시스템에서 발생하는 실수는 발견하기가 쉽지 않을 것이다. 그리고 이런 오류는 수백만 달러의 매출 손실로 이어질 수 있다. 생성형 AI 시스템 사용자들은 AI가 내놓은 결과를 복음이라도 되는 것처럼 받아들이는 경향이 있다. 이런 실수는 종종 큰 피해로 이어지고, 몇 달이 지나서야 발견되는 경우가 많다. AI가 바보가 되는 이유는 데이터 생성형 AI와 관련된 대부분 비즈니스 문제는 데이터 부족으로 인해 발생한다. 기업은 AI 툴을 선택하는 데만 시간을 쏟을 뿐, 이런 AI 모델에 견고한 학습 데이터를 제공하기 위해 데이터를 더 나은 상태로 만드는 데는 충분한 시간을 투자하지 않는다. 그래서 시스템은 '지저분한 데이터'를 소비하고, 결국 새로 구축된 LLM 또는 SLM(Small Language Model)에서 온갖 문제가 발생한다. 기업은 이 문제를 알고 있지만, 수집되는 데이터를 수정하지 않고 생성형 AI 시스템을 계속 진행해도 괜찮다고 생각한다. AI 툴이 결함이 있거나 오류가 있는 데이터를 찾아내 고려 대상에서 제외할 것이라고 생각해 버린다. 데이터를 학습하기 전에 검증 프로세스를 거친다면, AI 시스템이 이런 작업을 수행할 수도 있다. 하지만, 검증 프로세스가 잘못된 데이터를 찾아서 제거할 수 있지만, 불충분한 데이터가 모두 잘못된 데이터로 보이지는 않는다. 잘못된 데이터가 학습 데이터로 수집되면 생성형 AI 시스템은 점점 더 멍청해질 것이다. 기업이 생성형 AI 때문에 겪고 있는 문제의 대부분은 품질이 좋지 않은 데이터나 처음부터 사용해서는 안 되는 데이터와 관련이 있다. 데이터 문제를 해결하는 것이 쉽다고 생각할 수 있지만, 대부분 기업에서 데이터를 깨끗한 상태로 만드는 데는 수백만 달러의 비용이 들고, 시간도 수개월 또는 수년이 걸린다. 이 때문에 많은 기업이 데이터가 아닌 AI에 돈을 쓰고 있는 것이다. 이런 식으로 결과가 달라질 수 있을까? 또한 생성형 AI 시스템은 편견에 취약하다. 학습 데이터에 편견이나 부정확한 내용이 포함되어 있으면 모델이 생성된 콘텐츠에서 의도치 않게 편견을 지속시키거나 증폭시킬 수 있다. 모델에 편향성이 있다면, 이를 제거하기 위한 작업이 필요하다. 하지만 모델의 여러 부분에 편향이 있을 수 있으며, 이를 따로 떼어내 제거하는 것은 쉽지 않은 작업이다. 생성형 AI의 다른 문제 상식 부족은 생성형 AI가 "바보같다"고 인식되는 주요 요인 중 하나이다. 이런 시스템은 인간과 달리 세상에 대한 기반 지식이 없으며, 학습 과정에서 학습한 통계적 패턴에 의존한다. 따라서 실제 세계에 대한 더 깊은 이해가 필요한 반응이 나올 수 있다. 고려해야 할 또 다른 측면은 입력 문구에 대한 생성형 AI의 민감도이다. 시스템은 프롬프트를 통해 사람으로부터 받은 입력이나 API를 사용하는 애플리케이션으로부터 받은 입력에 따라 응답을 생성한다. 문구를 조금만 변경해도 결과가 크게 달라질 수 있다. 이런 민감성 때문에 AI는 때때로 예상치 못한 또는 관련 없는 응답을 생성한다. AI가 제공하는 가치의 대부분은 적절한 질문을 하고 적절한 방법을 사용해야만 얻을 수 있다. 또한 비즈니스 데이터와 저작권 또는 지적재산권 소유권 문제가 발생할 수 있는 데이터를 구분하지 못하는 문제도 드러나고 있다. 예를 들어, 8,500명 이상의 저작자가 서명한 미국 작가조합의 공개 서한은 오픈AI(챗GPT), 구글(제미나이, 구 바드) 등 생성형 AI 애플리케이션을 담당하는 IT 업체에 적절한 허가나 보상 없이 저작물을 사용하는 것을 중단할 것을 촉구하고 있다. 필자도 LLM에 질문한 적이 있는데, 필자의 저작물 내용 중 일부를 앵무새처럼 되풀이하는 경우가 몇 번 있었다. 필자의 책과 수천 개의 기사가 이런 LLM의 학습 데이터로 사용됐을 것이다. 비즈니스 처리의 일부에 이런 LLM을 사용하는 기업은 다른 사람의 지적 재산을 비즈니스 목적으로 사용할 경우, 소송을 당할 수 있다. 예를 들어, LLM은 공급망 최적화를 위해 저작권이 있는 텍스트에 설명된 공급망 관리 프로세스를 무의식적으로 사용할 수 있으며, 여기에는 공개된 알고리즘이 포함될 수 있다. 그렇기 때문에 대부분 업체가 비즈니스 목적으로 공개 생성형 AI 시스템을 사용하는 것을 금지하고 있다. 생성형 AI의 완성을 위한 여정을 계속해 나가려면, 이런 문제들을 해결하는 방법을 먼저 배워야 할 것이다. editor@itworld.co.kr
맥킨지는 생성형 AI가 매년 2조 6,000억 달러에서 4조 4,000억 달러의 가치를 창출할 수 있다고 추정했다. 이런 전망은 여러 산업에서 다양한 고객에게 개선, 효율성 및 새로운 제품을 제공하는 63가지 생성형 AI 사용례를 조사한 결과다. 생성형 AI가 가져다줄 경제적 이점의 핵심은 데이터다. 데이터는 생성형 AI가 주변 세계를 이해하고 분석하고 상호작용할 수 있도록 지원하면서 혁신적 역량을 강화한다. 따라서 생성형 AI로 성공을 거두기 위해서는 무엇보다 데이터를 잘 관리하고 잘 준비해야 한다. 동시에 기업은 대규모로 AI 서비스를 구축하고 운영하기 위한 기반을 마련해야 하며, 효과적이고 지속 가능한 방식으로 AI 이니셔티브에 자금을 지원해야 한다. 느리게 시작하고 단계적으로 지원을 축소하는 방식으로는 AI 경쟁에서 이길 수 없다. 데이터 관리 방식을 개선하지 않거나 확장 및 비용 계획에 올바른 방식으로 접근하지 않으면 생성형 AI의 잠재력을 놓치기 쉽다. 여기서는 데이터 관리 접근 방식을 개선하고 생성형 AI 이니셔티브를 장기적으로 지원하는 방법에 대해 살펴본다. 데이터 형태 및 출처 파악 데이터는 다양한 형태로 존재한다. 각 형태의 데이터를 올바르게 사용하면 AI 인사이트의 풍부함과 품질을 높일 수 있다. 가장 대표적인 데이터 형태는 일관적인 방식으로 조합된 정형 데이터다. 제품 정보, 고객 인구 통계 또는 재고 수준과 같은 항목을 포함하는 구조화된 데이터를 의미한다. 정형 데이터는 AI 응답의 품질을 향상하기 위해 생성형 AI 프로젝트에 추가할 수 있는 체계적인 사실 토대를 제공한다. 정형 데이터 소스가 내부에 있다면, 외부에서 생성된 데이터도 있을 것이다. 일기 예보, 주가, 교통량처럼 의사결정 과정에 필요한 실제적인 맥락을 보다 실시간으로 제공하는 데이터가 대표적 예다. 외부 데이터 소스를 내부의 정형 데이터 소스에 혼합함으로써 양질의 데이터를 추가적으로 제공할 수 있다. 다만 외부 데이터를 직접 생성하는 것은 적절하지 않을 수 있다. 분석 및 모델링 시나리오를 통해 생성된 데이터는 파생 데이터라고 한다. 고객 의도 보고서, 계절별 판매 예측 또는 코호트 분석과 같은 심층적인 인사이트가 파생 데이터에 포함된다. 정형 데이터와 반대되는 형태인 비정형 데이터도 있다. 데이터 분석가에게 익숙한 정기 보고서나 데이터가 아닌 이미지, 문서, 오디오 파일과 같은 형식이 대표적이다. 비정형 데이터는 인간의 의사소통과 표현의 뉘앙스를 포착한다. 따라서 생성형 AI 프로그램은 종종 생성형 AI 모델의 일반적인 입력/출력인 이미지나 오디오를 중심으로 작동한다. 확장 가능한 기반 마련 다양한 형태의 데이터세트는 모두 각각의 환경에 존재한다. 생성형 AI 프로젝트에서 이를 유용하게 활용하려면 다양한 데이터 환경에 실시간으로 접근할 수 있어야 한다. 데이터가 너무 많기 때문에 어떤 접근 방식이든 필요에 따라 동적으로 확장하고 전 세계적으로 데이터를 복제해 요청이 들어올 때 모든 리소스를 사용자 가까이에서 제공할 수 있어야 한다. 다운타임을 방지하고 트랜잭션 요청 내 지연 시간을 줄이기 위해 필요하다. 데이터는 생성형 AI 시스템이 효과적으로 사용할 수 있도록 준비해야 한다. 의미를 나타내는 수학적 값인 벡터 임베딩 생성을 포함한다. 임베딩을 사용하면 생성형 AI 시스템은 특정 텍스트 일치 항목을 넘어 데이터에 포함된 의미와 맥락을 포괄적으로 검색할 수 있다. 데이터의 원래 형태가 무엇이든 임베딩을 생성하면 생성형 AI 시스템에서 데이터를 이해하고 사용할 수 있으며, 데이터의 의미와 맥락도 유지할 수 있다. 임베딩을 통해 모든 데이터에서 벡터 검색 또는 하이브리드 검색을 지원하면 데이터의 가치와 의미를 동시에 결합할 수 있다. 그런 다음 이런 결과를 수집해 결과 조립에 사용되는 LLM로 다시 전달할 수 있다. 이런 식으로 LLM에만 의존하지 않고 여러 소스에서 더 많은 데이터를 사용하면 생성형 AI 프로젝트는 사용자에게 더 나은 결과를 제공할 수 있으며, 환각 현상을 줄일 수 있다. 이를 구현하려면 기반이 되는 데이터 패브릭을 올바르게 선택하는 것이 중요하다. 서로 다른 솔루션은 시간이 흐르면서 기업이 지원, 조사 및 관리해야 하는 또 다른 사일로가 되므로 각 솔루션에 보관된 데이터의 단편적인 짜깁기는 가능한 한 피하는 것이 좋으며, 사용자는 여러 컴포넌트가 응답하고 모델이 응답을 검토할 때까지 기다릴 필요 없이 신속하게 응답을 받을 수 있어야 한다. 통합 데이터 패브릭은 원활한 데이터 통합을 제공해 생성형 AI가 사용 가능한 모든 데이터를 활용할 수 있도록 지원해야 한다. 생성형 AI 구현을 확장하려면 중요한 자산에 대한 통제권 유지와 채택 속도 가속화 사이에서 균형을 맞춰야 한다. 모듈식 접근 방식을 채택해 생성형 AI 에이전트를 구축하면 구현을 세분화하고 잠재적인 병목 현상을 피할 수 있다. 애플리케이션을 위한 마이크로서비스 설계와 마찬가지로, AI 서비스에 대한 모듈식 접근 방식은 애플리케이션 및 소프트웨어 설계에 대한 베스트 프랙티스를 장려해 장애 지점을 제거하고 더 많은 잠재 사용자가 기술에 접근할 수 있도록 지원한다. 또한 기업 전반에서 에이전트의 성과를 보다 쉽게 모니터링하고 문제가 발생하는 위치를 보다 정확하게 파악할 수 있다. 모듈화의 첫 번째 이점은 설명 가능성이다. 생성형 AI 시스템과 관련한 컴포넌트가 서로 분리돼 있으므로 에이전트가 어떻게 작동하고 의사결정을 내리는지 분석하기가 더 쉬워진다. AI는 종종 '블랙박스'로 묘사되는데, 구획화하면 결과를 추적하고 설명하기 훨씬 쉽다. 두 번째 이점은 보안이다. 동급 최고의 인증 및 권한 부여 메커니즘으로 컴포넌트를 보호해 권한이 있는 사용자만 중요한 데이터와 기능에 접근할 수 있도록 보장할 수 있다. 또한 모듈화를 통해 PII(Personally Identifiable Information) 또는 IP(Intellectual Property)를 보호하고 기본 LLM과 분리해 보관할 수 있으므로 규정 준수 및 거버넌스가 더 쉬워진다. 효과적인 예산 정책 마이크로서비스 접근 방식과 함께 전반적인 생성형 AI 프로그램에 플랫폼 사고방식을 도입해야 한다. 전통적인 프로젝트 기반 펀딩 모델을 일관되고 유연한 펀딩 모델을 제공하는 것이다. 이런 접근 방식을 통해 프로젝트 구성원은 엄격한 자금 조달 주기나 비즈니스 사례의 제약을 받지 않고 가치 기반 의사결정을 내리고, 새로운 기회에 대응하며, 베스트 프랙티스를 개발할 수 있다. 이런 방식으로 예산을 처리하면 개발자와 비즈니스팀이 생성형 AI를 기업이 보유한 전체 인프라의 일부로 고려하도록 장려할 수 있다. 또한 워크로드 계획에 영향을 줄 수 있는 변동성의 최고점과 최저점을 쉽게 피할 수 있고, 시간이 지나도 일관성을 유지하는 CoE(Center of Excellence) 접근 방식을 취하기도 쉽다. 생성형 AI를 소프트웨어가 아닌 비즈니스에서 자체적으로 운영하는 제품으로 취급하는 것도 유사한 접근 방식이다. AI 에이전트를 상품으로 관리해야 하는 이유는 통합, 도구, 프롬프트와 관련한 지원을 더 쉽게 얻을 수 있을 뿐 아니라 AI 에이전트가 효과적으로 창출되는 가치를 대변하기 때문이다. 이를 통해 기업 전반에 생성형 AI에 대한 이해가 널리 확산할 수 있으며, 관련 전문 지식을 공유하는 협업 문화도 조성할 수 있다. 생성형 AI는 엄청난 잠재력을 가지고 있다. 여러 기업이 새로운 도구, 에이전트, 프롬프트를 서둘러 운영에 도입하고 있다. 하지만 생성형 AI 프로젝트를 프로덕션으로 전환하려면 데이터를 효과적으로 관리하고, 시스템 확장 기반을 마련하고, 팀을 지원할 수 있는 적절한 예산 모델을 마련하는 것이 수반돼야 한다. *Dom Couldwell은 DataStax의 EMEA 지역 현장 엔지니어링 책임자다. editor@itworld.co.kr
최근 필자는 클라우드 컴퓨팅을 둘러싼 문제와 전력 소비, 그리고 지구에 미치는 잠재적 영향을 다룬 다큐멘터리 ‘’에 참여했다. 이 다큐멘터리는 관점의 균형을 잡는 데 큰 역할을 했다. 데이터센터가 존재해서는 안 된다고 주장하는 사람은 아무도 없겠지만, 이들 데이터센터는 효율적이어야 하고 전력 소비를 최소화해야 한다. 이는 우리가 사용하는 리소스를 최적화하는 것뿐만 아니라 지난 50년 동안의 ‘모든 데이터’를 저장한다는 사고방식에서 벗어나는 것을 의미한다. 2020년에는 전 세계적으로 64제타바이트의 데이터가 생성됐으며, 이후 몇 년 동안 데이터의 양은 더 늘어났다. 할 수 있는가? 그래야 하는가? 실제로 저장 데이터의 대부분은 보관할 필요가 없을 가능성이 높다. 소셜 미디어용 페타바이트급 이미지와 동영상, 대량의 스캔 문서, 4중 백업 목적의 데이터 등이 대다수이기 때문이다. 데이터에 관련해서 우리 모두는 죄를 짓고 있다. 대부분 사람들은 시스템이나 클라우드 및 소셜 미디어 서비스에 생각보다 많은 양의 데이터를 저장하고 있다. 데이터는 계속 증가하고 있으며, 이 모든 저장과 데이터 처리에는 엄청난 양의 전력이 필요하다. 데이터가 잡초처럼 늘어나는 상활에서, 그 영향력을 고려하기 시작해야 할까? 데이터를 더 잘 관리하고 탄소 배출량을 줄이기 위해 무엇을 할 수 있을까? 아니면 적어도 데이터의 증가를 줄일 수는 있을까? 이런 질문은 앞서 이야기했던 내용, 즉 가능한 한 최적화되고 비용이 적게 들며 전력 등의 자원이 덜 필요한 시스템을 구축하는 문제로 돌아가게 한다. 자원의 효율적인 사용은 비즈니스와 지속 가능성에 직접적으로 연결되는 상당한 이점을 갖고 있다. 지구에 좋은 것은 비즈니스에도 좋은 일이다. 클라우드는 친환경일까? 일반적인 생각과 달리 클라우드 컴퓨팅은 본질적으로 친환경적이지 않다. 클라우드 데이터센터는 인프라에 전력을 공급하고 유지하는 데 많은 에너지를 소모한다. 이는 누구에게도 놀라운 소식이 아닐 것이다. 클라우드는 데이터센터 면적의 최대 사용자가 되었으며, 경쟁자라고는 한창 성장하고 있는 AI용 데이터센터뿐이다. 하지만 잠깐만, 클라우드 제공업체도 태양열과 풍력을 사용하지 않나? 일부는 재생 에너지를 사용하지만 모두가 에너지 효율적인 방식을 채택하지는 않는다. 많은 클라우드 서비스가 석탄 화력에 의존하고 있다. 클라우드 서비스 업체에 어떤 데이터센터가 재생 에너지를 사용하는지 물어보라. 전력 유형이 복잡하고 시시각각 변한다며 답변을 회피할 가능성이 높다. 대부분 재생 에너지를 사용하지 않으며, 가까운 미래에도 그렇게 할 것이라고 단언하는 것이 지나친 억측은 아니다. 클라우드 컴퓨팅으로 인한 탄소 배출은 주로 서비스 업체의 플랫폼에서 소비되는 전력과 실행 애플리케이션의 비효율성에서 비롯된다. 클라우드 서비스 업체 자체는 서버를 최적화하는 멀티테넌트 시스템을 구축하는 데 탁월할 수 있지만, 고객이 이런 리소스를 얼마나 잘 활용하는지는 제어할 수 없다. 효율성 개선 최적화되지 않은 시스템이 큰 영향을 미치는 것은 바로 이 부분이다. 월말에 핀옵스 보고서를 보는 이들은 리소스를 배치하고 사용해야 한다는 것을 잘 알고 있다. 그러나 잘못 설계된 시스템은 필요한 리소스의 10배 이상을 소모할 수 있다. 이 문제를 해결하려면 애플리케이션과 데이터센터를 현대화해 클라우드 플랫폼에 완전히 최적화해야 한다. 여기에 드는 비용은 적지 않기 때문에 대부분 기업은 클라우드에서 시스템을 수정하는 대신 비효율적인 비용을 지불하고 그대로 실행하는 방법을 택한다. 태양광 패널과 전기 자동차 충전기(친환경 건물 인증의 일부)를 지나쳐 회의실로 향하면서 시스템이 필요한 자원의 약 50배를 사용한다는 사실이 알게 됐을 때 아이러니를 느끼지 않을 수 없다. 작은 마을을 한 달 동안 운영할 수 있는 전력을 일주일에 사용하는, 심히 최적화되지 않은 시스템을 가동하면 모든 친환경 인증의 장점은 사라지고 만다. 발상의 전환 클라우드 컴퓨팅에 대한 보다 환경 친화적인 접근 방식을 위해서는 전력 효율을 위한 애플리케이션의 세심한 최적화, 지속 가능성 점검을 통합한 개발 관행 등이 필요하다. 이는 결국 클라우드 비용 절감과 비즈니스의 기대에 부응하는 시스템 성능으로 이어지기 마련이다. 먼저 발상의 전환이 필요하다. 어떻게 하면 더 효율적이고 더 나은 시스템을 구축할 수 있을까? 성공을 위해 어떤 지표를 사용해야 할까? 우리는 문화를 근본적으로 바꿔야 하며, 테슬라를 구입하면 비즈니스에 가치를 돌려주지 못하는, 전력 소모가 많은 엉터리 시스템을 운영해도 된다고 스스로 속이기를 그만둬야 한다. 현재 직면하고 있는 실제 문제와 이를 해결하기 위해서는 비용을 지출하고, 위험을 감수하고, 큰 실수를 인정해야 한다는 사실을 내면으로 들여다보라. 대부분의 IT 경영진은 그렇게 하지 않겠지만, 결국에 누군가는 자신의 기업이 지속 가능성을 저해하고 있다는 사실을 깨닫게 될 것이다. 많은 기업이 같은 일을 하고 있다면 지속 가능성에 대한 인식만 있을 뿐, 지속 가능성에는 관심이 없는 것이 분명해진다. 그건 도움이 되지 않는다. editor@itworld.co.kr
일단 클라우드에 정착했다면, 혁신이 필요한 부분을 파악하고 AI를 간단하고 효과적으로 만들 수 있는 유니콘 솔루션 업체를 찾아야 한다. 인공지능은 바퀴 이후의 가장 위대한 발명품으로 선전되지만, 인공지능이 무엇을 의미하는지, 무엇을 해야 하는지 전혀 알지 못한다면 아무 의미가 없다. AI 관련 뉴스가 어지러울 정도로 쏟아져 나오다 보니 잡음과 신호를 걸러내기 어렵다. 매일 새로운 대규모 언어 모델(LLM)이 출시되고, 한쪽에서는 현실과 동떨어진 금액을 모금하는 업체가 등장하기도 한다. 새로 등장하는 LLM은 성능이나 기능 면에서 기존 업체를 뛰어넘는다. 몇 주 전에는 메타가 그랬고, 지난 주에는 구글의 제미나이가 챗GPT를 능가했다. 심지어 AI와 전혀 관련이 없는 충전기에도 AI 라벨이 붙는 실정이다. 하지만 실제로 대부분 기업은 아직 AI로 의미 있는 일을 하고 있지 않다. 기업이 AI를 제대로 활용하지 못할 것이란 말은 아니다. 하지만 AI는 혁신의 속도가 너무 빠르다. 아무리 AI에 정통한 관찰자라도 현재로서는 AI를 따라잡기 어렵다. 필자는 지난주에 한 숙련된 데이터 과학자와 이야기를 나누며 모든 AI 잡음을 어떻게 이해해야 하는지 물었다. 대답은 이해하지 못한다는 것이었다. 그렇다면 어떻게 해야 할까? AI의 미래를 제대로 이해하기 위해서는 최고의 업체들이 클라우드를 어떻게 이해했는지, 특히 AWS가 이를 실현하는 데 어떻게 기여했는지 되돌아볼 필요가 있다. 클라우드가 핵심 AI를 제대로 이해하는 첫 걸음은 클라우드이다. 클라우드가 AI에 발을 들여놓을 수 있도록 해주기 때문이다. 몇 년 전, 당시 AWS 데이터 과학 책임자였던 매트 우드는 빅데이터(데이터 과학 이전에 사용하던 용어, 데이터 과학은 AI 이전에 사용하던 용어)를 길들이기 위한 핵심은 탄력적인 인프라를 활용하는 것이라고 말했다. 우드는 "고가의 인프라를 구입하는 사람들은 문제 범위와 영역이 매우 빠르게 변화한다는 것을 알게 된다. 원래의 질문에 대한 답을 찾았을 때는 이미 비즈니스는 다른 곳으로 이동한 후이다”라고 강조했다. 물론 클라우드가 비싸다고 비판하는 37Signal의 공동 설립자 데이비드 하이네마이어 한손 같은 사람도 있다. 말도 안 되는 이야기다. 37Signals처럼 워크로드를 예측할 수 있을 정도로 느리게 성장하는 회사에서는 클라우드 환송이 효과적일 수 있지만, AI 관련 워크로드의 사전적 정의처럼 수요를 예측할 수 없는 회사에서는 절대적으로 잘못된 전략이다. 고객 수요를 충족하는 능력을 제약하는 인프라만큼 비용이 많이 드는 것은 없다. 다시 우드의 말로 돌아가 보자. "유연하고 변화하는 빅데이터 요구 사항에 신속하게 대응할 수 있는 환경이 필요하다." 이는 대부분 워크로드가 실험적인 성격이 강한 AI의 경우 특히 그렇다. "리소스 조합은 계속 진화하고 있다. 인프라를 구매하면 시간이 고정되어 있기 때문에 구매하는 즉시 비즈니스 관련성이 떨어진다. 문제가 없거나 더 이상 신경 쓰지 않아도 되는 문제를 해결하는 것이다.” 다시 한번 강조하지만, AI를 시작하기 위한 핵심은 성공을 향한 실험에 필요한 유연성을 확보할 수 있는 클라우드를 구축하는 것이다. 클라우드의 다음 단계 클라우드의 탄력적인 인프라를 통해 기업은 큰 비용을 들이지 않고도 승부를 걸 수 있다. 2019년 인터뷰에서 당시 AWS CEO(현 아마존 CEO) 앤디 재시는 클라우드에서 가장 큰 성공을 거둔 기업은 점진적인 접근 방식이 아니라 “판을 뒤집어” 크게 진행하는 기업이라고 말했다. AI 시대에 적용하자면, 재시의 말처럼 "클라우드에서는 여러 가지 다양한 반복을 시도하는 데 드는 비용이 훨씬 낮기 때문에 새로운 비즈니스 아이디어에 대한 위험을 감수하는 것"이 중요하다. AI가 과대 포장됐다는 반박은 타당하지만, 재시라면 여전히 보수적인 전략에 드는 비용이 더 민첩한 AI 기반 스타트업에 의해 대체될 수 있다고 주장할 가능성이 높다. 재시는 "고객이 무엇을 원하는지, 시간이 지남에 따라 요구될 고객 경험은 무엇인지 생각해야 한다. 그리고 일반적으로 이를 위해서는 꽤 큰 변화나 혁신이 필요하다”라고 말했다. AI도 마찬가지다. 다시 말하지만, 클라우드를 통해 기업은 점진적인 방식으로 큰 승부를 걸 수 있다. 그렇다면, 이제 질문은 누가 이런 점진적인 대규모 승부의 실행을 주도해야 하는지로 이어진다. 수년 동안 개발자는 오픈소스 소프트웨어와 클라우드 인프라를 통해 빠르게 혁신하는 힘의 중심이었다. 하지만 개발자에게는 지원이 필요하며, 그 지원은 CEO가 제공해야 한다. 재시는 "클라우드 전환의 가장 큰 초기 과제는 기술적인 문제가 아니라 리더십, 즉 경영진의 리더십에 관한 것"이라고 말한다. 개발자는 일을 처리하는 방법을 알아내는 데는 뛰어나지만, CEO의 권한이 있어야 혁신을 추진할 수 있다. 승자의 조건 : 사용하기 쉬울 것 솔루션 업체는 어떨까? AI 분야의 승자는 가장 정교한 LLM을 만들거나 가장 기능이 풍부한 벡터 데이터베이스를 개발하는 업체가 아닐지도 모른다. 아니, AI를 가장 쉽게 사용할 수 있게 만드는 업체가 승자가 될 것이다. 새삼스러운 일도 아니다. 클라우드 분야의 승자는 기업이 클라우드 서비스를 더 쉽게 사용할 수 있게 만든 AWS였다. 오픈소스/리눅스 초기의 승자는 리눅스 실행과 관련된 복잡성을 제거한 레드햇이었다. 구글은 검색 기능을 최초로 개발한 것은 아니지만 검색과 관련된 번거로움을 제거한 최초의 업체이다. 깃허브는 개발자에게 코드를 저장하고 공유할 수 있는 방법을 최초로 제공한 것이 아니라 개발자가 대규모로 사용할 수 있도록 만든 최초의 서비스이다. 이런 예도 헤아릴 수 없이 많다. AI 역시 이런 업체가 필요하다. 물론 기업은 클라우드 실험을 통해 AI 성공의 길을 느낄 수 있지만, AI 분야의 승자는 오픈AI나 또 다른 LLM을 만드는 곳이 아닐 것이다. 필자는 기업이 AI를 생산적으로 사용하기 쉽게 만드는 업체에 돈을 걸 것이다. editor@itworld.co.kr
매일매일 업데이트되는뉴스레터 받아보기
테크라이브러리자료 업로드 신청
현재 마이크로소프트는 AI 분야의 선두 주자다. 27일(현지시간) 종가 기준 마이크로소프트의 시가총액은 3조 1300억 달러(약 4,218조 원)로, 지구상에서 가장 가치 있는 회사다. 이런 상승세는 오늘날 선풍적인 인기를 끌고 있는 챗GPT를 만든 오픈AI와의 투자 관계 덕분이다. 오픈AI의 GPT는 마이크로소프트가 깃허브, 윈도우, 마이크로소프트 365 등 거의 모든 제품에 내장하고 있는 생성형 AI 도구인 마이크로소프트 코파일럿의 기반이다. 마이크로소프트의 AI 우위는 극복할 수 없는 것처럼 보인다. 하지만 기술 분야에서는 상황이 빠르게 변할 수 있다. 애플은 구글의 생성형 AI 도구 제미나이를 아이폰에 탑재하기 위해 협상을 진행 중이며, 협상이 성사되면 생각보다 빨리 마이크로소프트의 자리를 빼앗을 수 있다. 동시에 마이크로소프트는 업계 최고의 AI 인재를 영입하고, 코파일럿의 개선된 버전을 출시하기 위해 맹렬히 경쟁하고, 코파일럿 수익화를 시작하는...
기업이 사이버 공격에 맞서기 위해서는 네트워크 세분화, 샌드박스, 방화벽, 이상 탐지 기능을 강화해야 하는 것으로 나타났다. 또한 지난 한 해 동안 기업의 보안 준비도는 하락한 반면 보안에 대한 신뢰도는 오히려 높아진 것으로 나타났는데, 우려스러운 추세라는 분석이다. 시스코가 발표한 2024 사이버보안 준비 지수(2024 Cybersecurity Readiness Index) 보고서의 주요 내용이다. 이런 신뢰 수준과 보안 준비도 간의 격차는 기업이 위협 환경을 탐지하는 능력을 과신하고 있으며 직면한 문제를 제대로 파악하지 못하고 있음을 시사한다. 이번 설문은 전 세계 30개국의 비즈니스 및 사이버보안 리더 8,000명을 대상으로 조사했다. 글로벌 기업의 3%만이 최신 사이버보안 위험에 탄력적으로 대응하는 데 필요한 '성숙한' 수준의 준비성을 갖춘 것으로 나타났다. 불과 1년 전 준비성 수준이 15%였던 것과 비교하면 매우 낮은 수치라고 시스코 전략 참여 담당 이사 ...
2005년 이후 유튜브는 다양한 동영상으로 우리를 즐겁게 했다. 초기에는 바이럴 동영상의 수요가 더 많았지만, 2010년 이후에는 뮤직비디오의 인기가 가장 높다. 예를 들어 아델의 '헬로(Hello)' 뮤직비디오는 불과 87일만에, (현재까지) 역사상 가장 빠르게 10억 뷰를 넘어섰다. 그럼에도 이 영상 조차 역대 가장 많이 본 동영상 상위 10위에 들지 못했다. 2024년 2월 기준 가장 많이 재생된 유튜브 동영상 10개는 다음과 같다. 10위부터 역순으로 알아보자. 10위 : 미로쉬카 ТV "색깔 배우기 - 농장의 알록달록한 계란" 릴리즈 날짜 : 2018년 2월 26일 조회수 : 50억 10위는 아이들에게 러시아어로 다양한 색을 알려주는 러시아 채널 미로쉬카 TV(Мiroschka ТV)의 교육용 동영상이다. 이 영상은 농장에 있는 여러 개의 달걀이 단계적으로 색을 갈아 입는 애니메이션이다. 2018년부터 50억 회 이상 클릭됐다.  ...
오늘날의 네트워크 환경은 수작업만으로 추적하기에는 너무 복잡하다. IT팀은 디지털 트윈 기술을 통해 프로덕션 네트워크의 가상 모델을 구축하고 이를 사용해 구성을 검증하고 변경 사항을 시뮬레이션하며 관리를 간소화할 수 있다. 물리적 사물이나 시스템을 디지털로 표현한 디지털 트윈의 사용이 증가하고 있다. 기업은 디지털 트윈을 사용해 인프라, 네트워크 장비, IoT 디바이스 등 IT 환경을 복제하고 시뮬레이션을 실행해 변경의 영향을 테스트하고 성능을 최적화할 수 있다. 예를 들어 네트워크의 현재 상태를 검증하고 구성 변경, 펌웨어 업데이트 또는 보안 정책 조정을 테스트하는 데 사용할 수 있다. 디지털 트윈 기술은 이렇게 물리적 세계와 가상 세계 사이의 격차를 해소할 수 있는 잠재력으로 주목을 받고 있다. 그랜드 뷰 리서치에 따르면, 글로벌 디지털 트윈 시장은 2023년부터 2030년까지 연평균 38%의 높은 성장률을 기록할 것으로 전망된다. 인공지능, 클라우드 컴퓨팅, ...
오픈 데이터의 흐름이 전 세계적으로 확산하고 있다. 이는 엄청난 혁신을 불러일으킬 것으로 기대된다. 실제로 매켄지는 자유롭게 사용하고 재배포할 수 있는 데이터인 오픈 데이터가 세계 경제에 연간 3조 달러의 기여를 할 수 있으며, 혁신을 일으키고 경제의 모든 부문을 변화시킬 수 있는 잠재력을 가지고 있다고 평가한다. 세계은행도 오픈 데이터의 큰 잠재력을 인정하며, 민간 기업의 공공 데이터 사용이 "이제 막 활용되기 시작했다"고 분석했다. 새로운 디지털 정책을 앞장서 추진하고 있는 EU는 최근 공공 부문 기관이 무료로 사용할 수 있는 새로운 '고가치 데이터 세트'를 추가한 오픈 데이터 지침(Open Data Directive)을 시행했다. 이 데이터 세트에는 지리공간과 환경, 기상, 통계, 모빌리티, 기업 데이터가 포함되는데, 이를 통해 사회의 디지털 혁신을 장려하고 이동성과 의료, 에너지 절약, 지속 가능성을 개선하는 것을 목표로 한다. 티에리 브르통 EU 집행위원장은...
직업 사이트 연구 및 교육 업계의 새로운 데이터에 따르면, 2024년 기업이 전문가에게 원하는 역량이 생성형 AI의 도입으로 인해 바뀌고 있다. 생성형 AI는 노동자를 대체하기보다는 자동화할 수 있는 일상적인 업무는 줄이고 제품 개발과 같은 창의적인 업무에 더 집중할 수 있게 도와줄 것으로 기대된다. 프리랜서 고용 플랫폼 업워크(Upwork)는 최근 2023년 전체 프리랜서 노동자의 수입에 대한 연구를 발표했는데, 그 결과 생성형 AI와 데이터 과학 및 분석 기술의 중요성이 전례 없는 성장을 보이고 있는 것으로 나타났다. 또한 업워크 연구는 AI를 활용하는 프리랜서가 더 복잡하고 더 높은 가치를 창출하고 결과적으로 더 높은 수익을 얻는 기술 역량 중심의 변화가 있음을 확인했다. 업워크 리서치 인스티튜트의 매니징 디렉터 켈리 모나한은 최근 블로그 게시물에서 "AI가 대부분 일자리를 대체할 가능성은 낮지만, 가치를 창출하는 데 필...
자바는 지난 몇 년에 걸쳐 여러 가지 큰 변화를 거쳤다. 특히 얼핏 무관해 보이는 여러 힘이 함께 작용하며 플랫폼의 사용 편의성을 더 높였다. 자동 컴파일, var 키워드와 같은 새로운 기능으로 초보자와 숙련자 모두 자바를 더 편하게 사용할 수 있게 됐다. 새롭고 더 친화적인 이번 자바에서 관심을 끄는 것은 무엇인지 살펴보자. 적어도 오랜 자바 사용자에게 현대 자바의 가장 놀라운 점은 var 지원이라고 할 수 있다. 자바의 대표적인 특징 중 하나는 강력한 형식 지정인데 var는 이것을 약간 느슨하게 풀어준다. 이제 메서드 내에서 컴파일러가 형식을 추적하는 var를 사용해 참조를 정의할 수 있다. 자바 개발자는 이 기능의 도입을 두고 불안에 떨었지만 정작 지원이 시작되자 그런 불안이 무색할 만큼, 마치 자바에 원래부터 있던 기능인 듯 아무렇지도 않게 받아들였다. var numbers = new ArrayList<In...
마이크로소프트의 오픈소스 프로그래밍 편집기인 비주얼 스튜디오 코드는 많은 확장 프로그램을 통해 모든 개발자에게 강력한 도구가 되어 준다. 확장 프로그램 없이도 유용한 기능을 기본적으로 풍부하게 갖추고 있다. 다만 이런 기능 일부가 명확히 드러나 있지는 않아서 경험이 많은 사용자라 해도 모르는 경우가 있다. 또한 VS 코드 새 릴리즈가 나올 때마다 추가되는 유용한 기능도 눈에 띄지 않는 경우가 많다. 아직 잘 알려지지 않은 유용한 비주얼 스튜디오 코드 팁과 단축키 10가지를 소개한다. 대다수 팁은 초보부터 숙련된 베테랑에 이르기까지 모든 VS 코드 개발자에게 도움이 될 것이다. VS 코드 명령 찾기 VS 코드의 명령을 찾고 싶을 때는 Ctrl + Shift + P를 누르고 입력을 시작한다. 명령 팔레트라는 기능이 작동하면서 모든 등록된 명령(추가 기능이 제공하는 명령 포함)에 빠르게 접근할 수 있게 해준다. 또한, 특정 명령...
엔터프라이즈 IT는 오랫동안 서로 어긋나는 인프라를 선택해야 하는 악조건 속에 있었는데, 최근에는 상황이 더 악화했다. 예를 들어, 클라우드는 모든 것을 개선할 것처럼 약속했지만 10년 이상 클라우드 네이티브에 투자한 결과는 달랐다. 마이크로서비스와 API, 그밖에 점점 늘어나는 '클라우드 네이티브 모범 사례'를 만들어 IT 환경을 더 복잡하게 만들었다. 그렇다면 AI가 이 모든 것을 해결할 수 있을까? 이에 대한 대답은 명확하다. 정상적인 IT 담당자라면 챗GPT를 CRM이나 ERP 시스템에 연결하려 하지는 않을 것이다. AI를 제어할 거버넌스가 부재하기 때문이다. 그러나 복잡성과 다소 어려운 거시 경제 환경에도 불구하고 "훌륭한 소프트웨어를 만드는 목표를 포기해서는 안 된다"고 아폴로 그래프QL의 CTO이자 공동 창립자인 매트 디버갈리스는 말한다. 낡고 복잡한 인프라를 붙잡고 있는다고 해서 해결되는 것은 아무 것도 없다는 것이다. 대신 그가 제시하는 해법은 '슈퍼...
온라인 스토리지 계정을 여러 개 소유한 사용자라면, 각각의 웹사이트와 클라이언트로 모든 온라인 스토리지를 관리하기가 무척 번거롭다는 것을 잘 알고 있을 것이다. 무엇이 어디에 저장되어 있는지만 기억하는 것도 보통 일이 아니다. 그러나 클라우드마운터(CloudMounter), 익스팬드라이브(ExpanDrive), 마운틴 덕(Mountain Duck), 에어라 이브 드라이브(Air Live Drive), 레이드라이브(RaiDrive)와 같은 애플리케이션을 발견하면서 이런 번거로움은 사실상 종료됐다. 이들 클라우드 스토리지 관리자 앱은 온라인 스토리지 서비스와 FTP/SFTP 및 WebDAV를 연결해 윈도우 탐색기, macOS 파인더 같은 운영체제 내 파일 관리자에 통합한다. 연결 속도는 약간 느리기는 해도 실제와 똑같이 작동하고 드라이브 문자도 할당된 로컬 또는 로컬 또는 네트워크 드라이브로 나타난다. 여기에 더해 추가 소프트웨어나 웹 브라우저를 실행하지 않고도 온라...
회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512 | 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일
발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규 | 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950
Copyright © 2024 International Data Group. All rights reserved.