Формирование нейросетевой архитектуры модели и загрузка ее весов для получения признаков / оценок на базе нейросетевых признаков (текстовая модальность)


  • _b5.text_model_nn_ - Нейросетевая модель tf.keras.Model для признаков / оценок на базе нейросетевых признаков

Импорт необходимых инструментов

[2]:
from oceanai.modules.lab.build import Run

Сборка

[3]:
_b5 = Run(
    lang = 'ru', # Язык
    color_simple = '#333', # Цвет обычного текста (шестнадцатеричный код)
    color_info = '#1776D2', # Цвет текста содержащего информацию (шестнадцатеричный код)
    color_err = '#FF0000', # Цвет текста содержащего ошибку (шестнадцатеричный код)
    color_true = '#008001', # Цвет текста содержащего положительную информацию (шестнадцатеричный код)
    bold_text = True, # Жирное начертание текста
    num_to_df_display = 30, # Количество строк для отображения в таблицах
    text_runtime = 'Время выполнения', # Текст времени выполнения
    metadata = True # Отображение информации о библиотеке
)

[2023-12-10 16:55:37] OCEANAI - персональные качества личности человека:    Авторы:        Рюмина Елена [ryumina_ev@mail.ru]        Рюмин Дмитрий [dl_03.03.1991@mail.ru]        Карпов Алексей [karpov@iias.spb.su]    Сопровождающие:        Рюмина Елена [ryumina_ev@mail.ru]        Рюмин Дмитрий [dl_03.03.1991@mail.ru]    Версия: 1.0.0a5    Лицензия: BSD License

Формирование нейросетевой архитектуры модели (FI V2)

[4]:
res_load_text_model_nn_fi = _b5.load_text_model_nn(
    corpus = "fi", # Корпус для тестирования нейросетевой модели
    show_summary = False, # Отображение сформированной нейросетевой архитектуры модели
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2023-12-10 16:55:40] Формирование нейросетевой архитектуры для получения оценок по нейросетевым признакам (текстовая модальность) …

— Время выполнения: 1.03 сек. —

Загрузка весов нейросетевой модели

[5]:
# Настройки ядра
_b5.path_to_save_ = './models' # Директория для сохранения файла
_b5.chunk_size_ = 2000000 # Размер загрузки файла из сети за 1 шаг

url = _b5.weights_for_big5_['text']['fi']['nn']['sberdisk']

res_load_text_model_weights_nn_fi = _b5.load_text_model_weights_nn(
    url = url, # Полный путь к файлу с весами нейросетевой модели
    force_reload = True, # Принудительная загрузка файла с весами нейросетевой модели из сети
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2023-12-10 16:55:45] Загрузка весов нейросетевой модели для получения оценок по нейросетевым признакам (текстовая модальность) …

[2023-12-10 16:55:45] Загрузка файла “weights_2023-07-03_15-01-08.h5” 100.0% …

— Время выполнения: 0.393 сек. —

Отображение сформированной нейросетевой архитектуры модели

[6]:
_b5.text_model_nn_.summary()
Model: "model"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to
==================================================================================================
 model_nn/input (InputLayer)    [(None, 104, 768)]   0           []

 model_nn/bilstm_1 (Bidirection  (None, 104, 64)     205056      ['model_nn/input[0][0]']
 al)

 model_nn/attention (Attention)  (None, 104, 64)     0           ['model_nn/bilstm_1[0][0]',
                                                                  'model_nn/bilstm_1[0][0]']

 model_nn/dence_2 (Dense)       (None, 104, 128)     8320        ['model_nn/attention[0][0]']

 model_nn/add (Addition)        (None, 256)          0           ['model_nn/dence_2[0][0]']

 model_nn/dence_3 (Dense)       (None, 128)          32896       ['model_nn/add[0][0]']

 dense (Dense)                  (None, 5)            645         ['model_nn/dence_3[0][0]']

==================================================================================================
Total params: 246,917
Trainable params: 246,917
Non-trainable params: 0
__________________________________________________________________________________________________

Формирование нейросетевой архитектуры модели (MuPTA)

[7]:
res_load_text_model_nn_mupta = _b5.load_text_model_nn(
    corpus = "mupta", # Корпус для тестирования нейросетевой модели
    show_summary = False, # Отображение сформированной нейросетевой архитектуры модели
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2023-12-10 16:55:49] Формирование нейросетевой архитектуры для получения оценок по нейросетевым признакам (текстовая модальность) …

— Время выполнения: 0.264 сек. —

Загрузка весов нейросетевой модели

[8]:
# Настройки ядра
_b5.path_to_save_ = './models' # Директория для сохранения файла
_b5.chunk_size_ = 2000000 # Размер загрузки файла из сети за 1 шаг

url = _b5.weights_for_big5_['text']['mupta']['nn']['sberdisk']

res_load_text_model_weights_nn_mupta = _b5.load_text_model_weights_nn(
    url = url, # Полный путь к файлу с весами нейросетевой модели
    force_reload = True, # Принудительная загрузка файла с весами нейросетевой модели из сети
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2023-12-10 16:55:51] Загрузка весов нейросетевой модели для получения оценок по нейросетевым признакам (текстовая модальность) …

[2023-12-10 16:55:52] Загрузка файла “weights_2023-07-16_18-12-01.h5” 100.0% …

— Время выполнения: 0.373 сек. —

Отображение сформированной нейросетевой архитектуры модели

[9]:
_b5.text_model_nn_.summary()
Model: "model_1"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to
==================================================================================================
 model_nn/input (InputLayer)    [(None, 414, 768)]   0           []

 model_nn/bilstm_1 (Bidirection  (None, 414, 64)     205056      ['model_nn/input[0][0]']
 al)

 model_nn/attention (Attention)  (None, 414, 64)     0           ['model_nn/bilstm_1[0][0]',
                                                                  'model_nn/bilstm_1[0][0]']

 model_nn/dence_2 (Dense)       (None, 414, 128)     8320        ['model_nn/attention[0][0]']

 model_nn/add (Addition)        (None, 256)          0           ['model_nn/dence_2[0][0]']

 model_nn/dence_3 (Dense)       (None, 128)          32896       ['model_nn/add[0][0]']

 dense_1 (Dense)                (None, 5)            645         ['model_nn/dence_3[0][0]']

==================================================================================================
Total params: 246,917
Trainable params: 246,917
Non-trainable params: 0
__________________________________________________________________________________________________