새소식

반응형
Programming Language/Python

[Python] 파이썬 텍스트를 오디오로 변환하기(gTTS)

  • -
반응형

파이썬 텍스트를 오디오로 변환하기


gTTS(Google Text-to-Speech)는 파이썬에서 사용할 수 있는 라이브러리다. 구체적으로 말하면 gTTS는 파이썬에서 사용할 수 있는 외부 라이브러리이다. 이 라이브러리를 사용하면 텍스트를 음성으로 변환하고 이를 오디오 파일로 저장할 수 있고. gTTS 라이브러리는 Google TTS 엔진에 액세스 하여 텍스트를 음성으로 변환한다. 

 

만약 gTTS가 설치되어 있지 않다면 현재 사용하고 있는 IDE에서 터미널창에 아래와 같은 명령어를 입력하여 설치한다.

pip install gTTS

 

gTTS 사용법

gTTS를 사용하는 방법은 생각보다 무척 간단하다. 아래의 예제를 살펴보며 어떻게 사용하는지 한 번 배워보자.

from gtts import gTTS
import os

# 텍스트 생성
text = "안녕하세요. gTTS를 사용한 예제입니다."

# gTTS 객체 생성
tts = gTTS(text, lang='ko')

# 음성을 오디오 파일로 저장
tts.save("output.mp3")

# 생성된 오디오 파일 실행 (Windows)
os.system("start output.mp3")

# 생성된 오디오 파일 실행 (Linux 또는 macOS)
# os.system("mpg321 output.mp3")
  1. gTTS 객체를 생성하려면 텍스트를 작성하고 해당 텍스트를 gTTS 생성자에 전달한다. 첫 번째 파라미터로 음성으로 변환할 텍스트를 넣고 두 번째 파라미터로는 어떤 언어로 변환할지에 대한 국가 코드를 넣어준다. 예를 들어, 영어는 'en', 한국어는 'ko'다.
  2. save 메서드를 사용하여 음성을 오디오 파일로 저장한다. 위의 예제에서는 output.mp3라는 파일로 저장한다.
  3. 음성 파일을 실행하기 위해 os.system. 함수를 사용한다. 이 코드는 Windows 환경에서는 start 명령을 사용하며, Linux 또는 macOS에서는 mpg321 또는 다른 오디오 재생 도구를 사용할 수 있다. 사용하는 운영체제에 맞게 주석 처리된 부분을 선택하면 된다.

위의 예제와 같이 오디오 파일을 실행하면 mp3 파일이 켜지고 재생 버튼을 눌러야 음성이 나오는데 필자는 프로그램을 실행하는 순간 오디오 파일로 변환되어 실행되었으면 했다, 그러다 보니 찾아낸 건 playsound 라이브러리였다.

 

playsound를 이용하여 gTTS 실행하기

playsound 라이브러리는 파이썬에서 오디오 파일을 재생하는 데 사용되는 간단한 라이브러리이다. 이 라이브러리를 사용하면 파이썬 스크립트에서 오디오 파일을 재생하고 음악, 음성, 효과음 등을 들을 수 있다.

 

playsound 라이브러리를 사용하려면 먼저 해당 라이브러리를 설치해야 한다. 아래와 같이 pip를 사용하여 설치할 수 있다.

pip install playsound

 

설치 후에 playsound 라이브러리의 playsound 함수를 사용하여 오디오 파일을 재생할 수 있다. 다음은 playsound를 사용하여 오디오 파일을 재생하는 예제이다.

from gtts import gTTS
from playsound import playsound

# 텍스트 생성
text = "안녕하세요. gTTS와 playsound를 사용한 예제입니다."

# gTTS 객체 생성
tts = gTTS(text, lang='ko')

# 음성을 오디오 파일로 저장
tts.save("output.mp3")

# 오디오 파일을 playsound를 사용하여 재생
playsound("output.mp3")

위의 코드를 실행하면 오디오 파일을 따로 재생해 줄 필요 없이 코드를 실행하면 playsound에 의해 오디오 파일이 자동으로 실행되게 된다.

 

gTTS의 주요 메서드

메서드명 메서드 내용
gTTS(text, lang = 'en', slow = False) gTTS 객체를 생성하는 메서드이다. text 매개변수에 변환하려는 텍스트를 지정하고, lang 매개변수로 언어를 설정하며, slow 매개변수로 음성 재생 속도를 조절할 수 있다.
save(filename) gTTS로 생성한 음성을 오디오 파일로 저장하는 메서드이다. filename 매개변수에 저장할 파일 이름(일반적으로 확장자 ".mp3" 사용)을 지정한다.
get_urls() gTTS로 변환된 음성 파일의 URL 목록을 가져올 수 있는 메서드이다. 이를 사용하여 생성된 음성 파일의 URL을 가져올 수 있다.
save_to_file(file) 생성된 음성을 파일로 저장하는 메서드이다. file 매개변수에 파일 경로와 이름을 전달한다.
get_tts_token() TTS(Text-to-Speech) 토큰을 가져오는 메서드로 내부적으로 사용된다.
tts_token TTS 토큰 값을 나타내는 속성이다.

gTTS 라이브러리는 텍스트를 음성으로 변환하는 데 사용되며 주요 메서드 및 기능을 제공한다. gTTS 객체를 생성하고 텍스트를 음성으로 변환 후, save 메서드나 save_to_file 메서드를 사용하여 음성을 오디오 파일로 저장하고 재생할 수 있다. 또한 get_urls 메서드를 사용하여 URL을 가져와 다른 용도로 사용할 수도 있다. 이러한 메서드를 활용하여 gTTS를 사용하면 텍스트를 음성으로 변환하고 관련된 작업을 수행할 수 있다.

 

 

읽어주셔서 감사합니다.

728x90
반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.