Привет!
В этой статье я опишу своего бота в телеграм, который работает и сейчас.
Для чего бот создавался, его цель и умения
В реальности человек использует множество звуков для выражения своих эмоций и отношений. Но почти все системы искусственного интеллекта и голосовые помощники "слишком интеллектуальные". Они просто отбрасывают эмоциональные звуки, не понимают и не могут правильно использовать междометия. Поэтому я создал бота, и он открывает возможность естественной речи, полной мычанием, скрипами, всхлипываниями, рыками и сотней других эмоциональных тонов и полутонов.
Предпологаю, что разрабатываемый алгоритм будет работать в коммерческом секторе, например, отслеживая эмоциональное состояние клиента и направлять ветвление алгоритма чтобы предупредить его возможные действия. Эмоции — первые регуляторы поведения и по тону речи или, например, по хмыканью легко отследить замешательство и раздражение пользователя и среагировать до того как он начнёт ругаться и требовать.
Можно так же придать и самим голосовым помощникам больше "человечности". Они могут откашливаться перед длинной лекцией или усмехаться вместо того, чтобы стандартным голосом объяснять что сейчас была шутка.
В медицинской практике программа поможет определить состояние пациента, который не может членораздельно говорить и по отдельным всхлипываниям сориентировать персонал на процедуру лечения. Она может применяться и для отдельных категорий заболеваний, таких как аутизм и дислексия.
В мессенджерах бот поможет передать чувства и отношения через сеть наравне, в дополнении или вместо стандартных эмоджи.
Как площадку для экспериментов и разработки я использую мессенджер "Телеграм".
На текущем моменте бот @YouToneBot возвращает звук эмоции на стандартный смайлик.
В дальнейшем планируется научить бота совершать обратную операцию, то есть на звуковой тон выдавать "эмодзи".
Какой он в итоге получится?
Он сможет отправлять голосовые сообщение, озвучивающие смайл, так же он сможет это делать прямо в чате! Даже не придётся переносить сообщение, достаточно будет написать его имя в сообщении, и написать свое сообщение.
Код
Итак, сейчас бот умеет выдавать голосовое сообщение, на смайл. Впрочем, ничего сложного, начнем.
Я написал бота на Python, используя библиотеку PyTelegramBotApi.
Сначала нужно узнать, как послать голосовое сообщение от бота. Я узнал, что бот может посылать те голосовые сообщения, которые были посланы ему, Т.К. у PyTelegramBotApi есть функция send_voice() используя id голосовго сообщения, его можно получить просто у функции message_handler() взять message.voice.file_id.
Теперь нужно придумать как хранить звуки к смайликам, и вот как я придумал: хранить в JSON , как ключ будет смайлик к которому бот будет отправлять звук, а как значение id голосового сообщения.
Соответственно, нам нужно послать голосовое сообщение боту, и записать его id, к смайлику. Вот и сложилось представление о базе данных звуков, нам всего лишь нужен "python словарь", и в него нужно записовать как ключ смайл, а как значение id голосового сообщения.
Вот примерно так:
{ "emoji1": "voice_id1", "emoji2": "voice_id2", "emoji3": "voice_id3", "emoji4": "voice_id4", "emoji5": "voice_id5", "emoji6": "voice_id6", } #почему-то не отображаются смайлики, поэтому "emoji" == ~смайлик
Вот именно так у меня устроена база данных звуков.
Теперь код.
Для начала я сделал класс YouTone(), чтобы писать все методы бота там.
В def init(self) я прописал TOKEN, VOICE_SOUNDS
TOKEN — Это просто токен бота
VOICE_SOUNDS — это словарь, из смайлов и id голосовых сообщений#база данных
И там же, в init, создаю переменную self.BOT, вот таким кодом
TL.TeleBot(self.TOKEN)
Это собственно, сам бот.
Итак, в классе сразу написал 3 функции, это
LS_handler() — отвечающая за личную переписку с ботом
start_handler() — отвечающая за команды боту (/start и /get) в личной переписке
local_lerning() — для записи голосовых сообщений к смайлам
В LS_handler() пока сделаем echo бота
def LS_handler(self): @self.BOT.message_handler(content_types=['text']) def send_text(message): def msg(message_text): self.BOT.send_message(message.chat.id, str(message_text)) msg(message.text)
В start_handler() пока просто на команду /start бот будет отвечать привет
def start_handler(self): @self.BOT.message_handler(commands=['start', "get"]) def commands(message): if message.text == "/start": self.BOT.send_message(message.chat.id, 'Привет. Я высылаю тебе звуки по смайлам')
И теперь займемся local_lerning(). Нам нужно записать к смайлам звуки охарактеризовающие смайл, для этого нужно послать голосовое сообщение боту, принять его на стороне бота, и записать к соответствующему смайлу.
Сделал я это так чтобы было удобо озвучивать, используя tkinter. На окне в tkitner показывается какой смайл нужно озвучить, посылается звук боту, на окне tkitner появляется кнопка "прослушить звук", я прослушиваю и если мне он нравится то нажимаю на "сохранить звук к смайлу", и к словарю базы данных дописывается (или перезаписывается):
смайл — как ключ
id голосового сообщения — как значение
Для этой функции я сделал 3 функции, и также базу данных просто смайликов без значений
window_smile() — само окно tkitner
bot_work() — это запуск работы бота, с возможностю приема голосовых сообщений.
save_sound() — для сохранения в файл смайла и id голосового сообщения
База данных смайликов — она нужна будет для создание базы данных смайликов со значениями
Итак, window_smile() это просто функция где рисуется и запускается окно
def window_smile():#эта функция принадлежит функции local_lerning() self.root = Tk() self.root.geometry("500x500") self.smile_tkinter = Label(text=self.AUDIO_SOUNDS_ITEMS[self.index][0],font='Times 30') self.open_sound = Button(text="Открыть звук",font='Times 10',command=lambda: webbrowser.open(url=r"путь/до/файла/в/котором/звук.ogg")) self.Y_or_N = Button(text="Принять звук",font='Times 15',command=save_sound) self.info = Label(text="""\n\n\n\n\n\n\nСмотришь на смайл, озвучиваешь,\n проверяешь,\n нажимаешь 'Принять звук',\n смайл меняется,\n ты его озвучивашь,\n проверяешь,\n нажимаешь принять звук.""",font="Consolas 11") self.smile_tkinter.pack() self.open_sound.pack() self.Y_or_N.pack() self.info.pack() self.root.mainloop()
bot_work() эта функция запускает бота, отслеживает входящие голосовые сообщения, и записывает их в "путь/до/файла/в/котором/звук.ogg",
def bot_work(): @self.BOT.message_handler(content_types=['text',"voice"]) def send_text(message): def msg(message_text): self.BOT.send_message(message.chat.id, str(message_text)) self.smile_now = self.SOUNDS_DB[self.index][0] self.smile_tkinter.config(text=self.smile_now) try: self.id_voice = message.voice.file_id self.voice_info = self.BOT.get_file(file_id=self.id_voice) self.voice_file = requests.get('https://api.telegram.org/file/bot{0}/{1}'.format(self.TOKEN, self.voice_info.file_path)).content except BaseException as e: print(e) else: with open("путь/до/файла/в/котором/звук.ogg", "wb") as f: f.write(self.voice_file)
Тут мы с помощю get_file(), поулчаем id файла (не голосового сообщения), с помощю id получаем сам файл через requests, и записываем его.
Также получаем id голосовго сообщения, и записываем его в self.voice_id.
def save_sound(): self.voices_good.update({self.smile_now:str(self.id_voice)}) self.index += 1 self.smile_now = self.SMILES_DB[self.index][0] self.smile_tkinter.config(text=self.smile_now) with open("data.txt","w",encoding="utf-8") as f: f.write(str(self.voices_good))
Эта функция вызывается по кнопке "принять звук".
Здесь мы обновляем словарь смайликов и голосовых сообщений новым смайлом и голосовым сообщением.
Также тут есть перменная о которой я не сказал, это self.index, в этой перменной хранится индекс смайлика который нужно озвучить на данный момент, Т.Е. индекс в списке self.SMILES_DB
Дальше я в функции local_lerning(), запускаю 2 функции в разных потоках, это
window_smile()и bot_work().
Делаю это я с помощю threading.
Вот так
from threading import Thread th1 = Thread(target=window_smile) th1.start() th2 = Thread(target=bot_work) th2.start()
def local_lerning(self): from threading import Thread self.smile_now = None self.index = 0 self.id_voice = None self.voices_good = { } self.smile_tkinter = None def save_sound(): self.voices_good.update({self.smile_now:str(self.id_voice)}) self.index += 1 self.smile_now = self.AUDIO_SOUNDS_ITEMS[self.index][0] self.smile_tkinter.config(text=self.smile_now) with open("data.txt","w",encoding="utf-8") as f: f.write(str(self.voices_good)) def window_smile(): self.root = Tk() self.root.geometry("500x500") self.smile_tkinter = Label(text=self.AUDIO_SOUNDS_ITEMS[self.index][0],font='Times 30') self.open_sound = Button(text="Открыть звук",font='Times 10',command=lambda: webbrowser.open(url=r"C:\Program Files\JetBrains\projects\telegram\voice.ogg")) self.Y_or_N = Button(text="Принять звук",font='Times 15',command=save_sound) self.info = Label(text="""\n\n\n\n\n\n\nСмотришь на смайл, озвучиваешь,\n проверяешь,\n нажимаешь 'Принять звук',\n смайл меняется,\n ты его озвучивашь,\n проверяешь,\n нажимаешь принять звук.""",font="Consolas 11") self.smile_tkinter.pack() self.open_sound.pack() self.Y_or_N.pack() self.info.pack() self.root.mainloop() def bot_work(): @self.BOT.message_handler(content_types=['text',"voice"]) def send_text(message): def msg(message_text): self.BOT.send_message(message.chat.id, str(message_text)) def snd_doc(name_doc): self.BOT.send_document(message.chat.id, open(name_doc, "rb")) self.smile_now = self.AUDIO_SOUNDS_ITEMS[self.index][0] self.smile_tkinter.config(text=self.smile_now) try: self.id_voice = message.voice.file_id self.voice_info = self.BOT.get_file(file_id=self.id_voice) self.voice_file = requests.get('https://api.telegram.org/file/bot{0}/{1}'.format(self.TOKEN, self.voice_info.file_path)).content except BaseException as e: print("ошибка: ",e) else: with open("voice.ogg", "wb") as f: f.write(self.voice_file) th1 = Thread(target=window_smile) th1.start() th2 = Thread(target=bot_work) th2.start()
Вот так выглядит озвучивание смаликов.
Итак, с помощю этой функции можно записать голосовые сообщения к смайлам. Так я и сделал.
В итоге у меня появилась база данных смайлов, и голосовых сообщений к ник.
Теперь нужно релизовать логику отправления голосовых сообщений при виде смайлов. Начнем сначала с личных сообщений, потом будет делать бота inline.
Для того чтобы обноружить смайлы в сообщении, я сделал простую функцию, разбивания сообщения на список, а потом проверяя нету ли в базе данных звуков и смайлов такого символа, если есть, то тогда звук на смайл найден.
Вот так она выгдялит
message_list = list(message.text) is_send = False for word in message_list: if word in self.VOICE_SOUNDS: if self.VOICE_SOUNDS[word]: snd_voice(voice_id=self.VOICE_SOUNDS[word]) print("smile has been found") is_send = True break if not is_send: print("smile has been not found")
def LS_handler(self): @self.BOT.message_handler(content_types=['text']) def send_text(message): def msg(message_text): self.BOT.send_message(message.chat.id, str(message_text)) def snd_doc(name_doc): self.BOT.send_document(message.chat.id, open(name_doc, "rb")) def snd_voice(voice_id: str): self.BOT.send_voice(message.chat.id,voice=voice_id) message_list = list(message.text) is_send = False for word in message_list: if word in self.VOICE_SOUNDS: if self.VOICE_SOUNDS[word]: snd_voice(voice_id=self.VOICE_SOUNDS[word]) is_send = True break if not is_send: msg("Я не нашел знакомого мне смайла
Вот собственно и весь LS_handler(), теперь почти тоже самое, только в inline_handler()
Бот inline работатет так что его нужно вызвать, просто написав его имя, и дальше написать ему сообщение, которое он прочитает и уже выдаст вам какой-то результат
def inline_handler(self): @self.BOT.inline_handler(lambda query: len(query.query) > 0) def query_text(query): message_list = list(query.query) #ставлю сразу что не нашел, а если найду, то поменяю ;) output_msg = [types.InlineQueryResultArticle( id="1", title="Я не нашел знакомого мне смайла ", input_message_content=types.InputTextMessageContent(message_text="Я не нашел знакомого мне смайла") )] is_send = False id_now = 1#id для сообщений for word in message_list: try: self.VOICE_SOUNDS[word] except KeyError: pass else: if self.VOICE_SOUNDS[word]: if is_send == False: output_msg = [] is_send = True if not word in [i.title for i in output_msg]:#если смайла нет в списке уже выданных смайлов, то надо добавить ;) output_msg.append(types.InlineQueryResultCachedVoice( id=str(id_now), voice_file_id=self.VOICE_SOUNDS[word], title=str(word), caption=query.query )) else: pass#типа если есть уже такой смайл то добавлять второй такой жене надо id_now +=1 #это для того чтобы id сообщений увеличивался self.BOT.answer_inline_query(query.id, output_msg)
Почти тоже самое, потому что там нужо сохранять в список множество смайлов которые были написаны боту, и потом выводить список доступных — озвучиваемых смайлов.
Т.Е. мы разделям строку поданую пользователем на символы, как и в прошлый раз, но не останавливаемся на первом смайле (в прошлый при виде смайла мы вызывали break), а сохраняем смайл в список, и ищем следующие смайлы. После чего выводим все звуки к смайлам.
И вот так сейчас уже можно использовать бота в inline
Заключение
В этой статье я рассказал больше про логику, нежели про код, почти как и в прошлой статье.
Бота @YouToneBot я еще буду развивать, хочу сделать чтобы пользователь мог записать голосовое сообщение, а бот выдать по нему смайл, Т.Е. наоборот нынешней работе бота.
Спасибо!
ссылка на оригинал статьи https://habr.com/ru/post/517044/
Добавить комментарий