Extracting features from a visual signal


Import required packages

[2]:
from oceanai.modules.lab.build import Run

Build

[3]:
_b5 = Run(
    lang = 'en', # Inference language
    color_simple = '#333', # Plain text color (hexadecimal code)
    color_info = '#1776D2', # The color of the text containing the information (hexadecimal code)
    color_err = '#FF0000', # Error text color (hexadecimal code)
    color_true = '#008001', # Text color containing positive information (hexadecimal code)
    bold_text = True, # Bold text
    num_to_df_display = 30, # Number of rows to display in tables
    text_runtime = 'Runtime', # Runtime text
    metadata = True # Displaying information about library
)

[2024-10-08 16:23:19] OCEANAI - персональные качества личности человека:    Авторы:        Рюмина Елена [ryumina_ev@mail.ru]        Рюмин Дмитрий [dl_03.03.1991@mail.ru]        Карпов Алексей [karpov@iias.spb.su]    Сопровождающие:        Рюмина Елена [ryumina_ev@mail.ru]        Рюмин Дмитрий [dl_03.03.1991@mail.ru]    Версия: 1.0.0a40    Лицензия: BSD License

Formation of the neural network architecture of the model

[4]:
res_load_video_model_deep_fe = _b5.load_video_model_deep_fe(
    show_summary = False, # Displaying the formed neural network architecture of the model
    out = True, # Display
    runtime = True, # Runtime count
    run = True # Run blocking
)

[2024-10-08 16:23:19] Формирование нейросетевой архитектуры для получения нейросетевых признаков (видео модальность) …

— Время выполнения: 0.105 сек. —

Downloading the weights of the neural network model

[5]:
# Настройки ядра
_b5.path_to_save_ = './models' # Директория для сохранения файла
_b5.chunk_size_ = 2000000 # Размер загрузки файла из сети за 1 шаг

url = _b5.weights_for_big5_['video']['fi']['fe']['googledisk']

res_load_video_model_weights_deep_fe = _b5.load_video_model_weights_deep_fe(
    url = url, # Полный путь к файлу с весами нейросетевой модели
    force_reload = True, # Принудительная загрузка файла с весами нейросетевой модели из сети
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2024-10-08 16:23:19] Загрузка весов нейросетевой модели для получения нейросетевых признаков (видео модальность) …

[2024-10-08 16:23:22] Загрузка файла “weights_2022-11-01_12-27-07.pth” 100.0% …

— Время выполнения: 3.994 сек. —

Process of extracting visual features (FI V2)

[6]:
# Настройки ядра
# Путь к видеофайлу
path = 'video_FI/test/_plk5k7PBEg.003.mp4'

hc_features, nn_features, emo_preds = _b5.get_visual_features(
    path = path, # Путь к видеофайлу
    reduction_fps = 5, # Понижение кадровой частоты
    window = 10, # Размер окна сегмента сигнала (в кадрах)
    step = 5, # Шаг сдвига окна сегмента сигнала (в кадрах)
    lang = 'en',
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2024-10-08 16:23:23] Извлечение признаков (экспертных и нейросетевых) из визуального сигнала …

[2024-10-08 16:23:24] Статистика извлеченных признаков из визуального сигнала:    Общее количество сегментов с:        1. экспертными признаками: 16        2. нейросетевыми признаками: 16    Размерность матрицы экспертных признаков одного сегмента: 10 ✕ 115    Размерность матрицы с нейросетевыми признаками одного сегмента: 10 ✕ 512     Понижение кадровой частоты: с 30 до 5

— Время выполнения: 1.331 сек. —

Process of extracting visual features (MuPTA)

[7]:
# Настройки ядра
# Путь к видеофайлу
path = 'video_FI/test/_plk5k7PBEg.003.mp4'

hc_features, nn_features, emo_preds = _b5.get_visual_features(
    path = path, # Путь к видеофайлу
    reduction_fps = 5, # Понижение кадровой частоты
    window = 10, # Размер окна сегмента сигнала (в кадрах)
    step = 5, # Шаг сдвига окна сегмента сигнала (в кадрах)
    lang = 'ru',
    out = True, # Отображение
    runtime = True, # Подсчет времени выполнения
    run = True # Блокировка выполнения
)

[2024-10-08 16:23:24] Извлечение признаков (экспертных и нейросетевых) из визуального сигнала …

[2024-10-08 16:23:25] Статистика извлеченных признаков из визуального сигнала:    Общее количество сегментов с:        1. экспертными признаками: 16        2. нейросетевыми признаками: 16    Размерность матрицы экспертных признаков одного сегмента: 10 ✕ 109    Размерность матрицы с нейросетевыми признаками одного сегмента: 10 ✕ 512     Понижение кадровой частоты: с 30 до 5

— Время выполнения: 1.2 сек. —