발자취

  • 홈
  • 태그
  • GitHub

2025/06 2

[AI] VLLM qwen3(tool_calls) web서버 사용 방법 ( 리눅스 )

vLLM은 대형 언어 모델(LLM)의 추론 및 서빙을 효율적이고 고속으로 처리할 수 있는 오픈소스 라이브러리입니다. 특징고성능 추론 및 서빙OpenAI 호환 API 서버다양한 모델 지원하드웨어 및 분산 추론 지원vllm web 서버 생성먼저 로컬 모델이나 허깅페이스에서 사용할 모델을 다운로드하거나 정해야 한다.chat-template ./qwen3_nonthinking.jinja은 https://qwen.readthedocs.io/en/latest/deployment/vllm.html 에서 다운로드할 수 있다. qwen3의 nothink를 위한 chat template이다 think를 사용하고 싶으면 안 해도 된다.vllm serve 로컬 모델경로 or 허깅페이스 가능 --served-model-nam..

AI 2025.06.25

[AI] Milvus 사용방법

1. Milvus 다운로드Milvus는 vectordb로 리눅스 환경에서 동작한다.https://milvus.io/docs/ko/install_standalone-docker-compose.md Docker Compose로 Milvus 실행하기(Linux) | Milvus 문서화Docker Compose를 사용하여 Milvus를 독립형으로 설치하는 방법을 알아보세요. | v2.6.xmilvus.io Docker Compose를 다운로드하기 위해 https://github.com/milvus-io/milvus/releases/ 에 접속해서 원하는 버전의 Docker Compose 파일을 다운로드한다.docker-compose.yaml은 Milvus를 실행시키기 위해 필요한 3개의 서비스 컨테이너 서비스를 ..

AI 2025.06.25
이전
1
다음
더보기
프로필사진

발자취

방문자수Total

  • Today :
  • Yesterday :
  • 분류 전체보기 (493)
    • OpenGL (23)
    • 코딩공부 (189)
      • Softeer (25)
      • 프로그래머스 (153)
      • 자료구조 (11)
    • Unity (83)
    • Unreal (10)
    • VisualStudio (93)
      • C# (39)
      • C#서버 (28)
      • C++ (8)
      • C++서버 (8)
      • WPF (10)
      • WCF (0)
    • AI (12)
    • Web (22)
      • JavaScripts (6)
      • React (16)
    • 형상관리 (7)
      • Git (3)
      • SVN (2)
      • Docker (2)
    • IT지식 (27)
      • NetWork (7)
      • CS (4)
      • Windows (5)
      • CentOS7 (5)
    • DB (24)
      • Mssql (16)
      • Oracle (8)
      • MachBase (0)
    • Error (2)

Tag

문자열 정렬, 문자열compare, 구하기, 관리, DFS, 폴더, 순열, 나머지, 정렬, 정리,

최근글과 인기글

  • 최근글
  • 인기글

공지사항

  • 블로그 소개

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
Github는 여기요

Copyright © Kakao Corp. All rights reserved.

  • GitHub

티스토리툴바