Operations

로컬 서버와 자동 실행을 점검하는 법

운영은 멋진 자동화보다 반복 가능한 확인 절차가 중요합니다. 스킬, cron, 채널, provider 를 분리해서 보면 대부분의 실패 원인을 빨리 찾을 수 있습니다.

문제가 생겼을 때 보는 순서

  1. 로컬 서버가 떠 있는지 확인합니다.
  2. 같은 스킬을 수동으로 실행해 스킬 자체가 정상인지 봅니다.
  3. LLM provider 응답 실패인지, 외부 API 실패인지, 채널 발송 실패인지 분리합니다.
  4. cron trigger 는 마지막에 확인합니다. 수동 실행이 실패하면 cron 도 실패합니다.

스케줄 운영

cron trigger 는 서버가 실행 중일 때만 의미가 있습니다. 노트북 절전, 네트워크 단절, provider quota 초과처럼 로컬 환경의 영향을 받기 때문에 중요한 알림은 처음 며칠 동안 수동 확인을 병행하는 것이 좋습니다.

업그레이드 전 체크

장애 원인 분리 예시

스킬 실패

CLI 수동 실행도 실패합니다. config, 외부 API, 스킬 코드부터 확인합니다.

LLM 실패

API key, 모델 이름, provider endpoint, local model tool-use 지원 여부를 확인합니다.

채널 실패

CLI 결과는 정상인데 Telegram/Slack/Discord/Kakao 발송만 실패합니다.

cron 실패

수동 실행은 정상인데 예약 시각에 실행되지 않습니다. 서버 실행 상태와 trigger 를 봅니다.

운영 기준

자동화는 한 번 성공보다 재시작 후에도 다시 성공하는지가 중요합니다. setup 저장, server restart, manual run, channel delivery 순서로 다시 확인하세요.