Публикации Научная статья на тему "Поддержка кластеризации"

Всероссийский сборник статей и публикаций института развития образования, повышения квалификации и переподготовки.


Скачать публикацию
Язык издания: русский
Периодичность: ежедневно
Вид издания: сборник
Версия издания: электронное сетевое
Публикация: Научная статья на тему "Поддержка кластеризации"
Автор: Шевченко Сергей Александрович

Шевченко Сергей Александрович студент 3-го курса РГУ нефти и газа (НИУ) имени И.М. Губкина (119991, Москва, Ленинский пр-т., д.65), тел. +7 (499) 507-88-88, e-mail: sergey.shevchenko04@gmail.com.Витулев Владислав Алексеевичстудент 3-го курса РГУ нефти и газа (НИУ) имени И.М. Губкина (119991, Москва, Ленинский пр-т., д.65), тел. +7 (499) 507-88-88, e-mail: vitulev2016@mail.ru.Карченков Кирилл Александрович студент 3-го курса РГУ нефти и газа (НИУ) имени И.М. Губкина (119991, Москва, Ленинский пр-т., д.65), тел. +7 (499) 507-88-88, e-mail: kirya.karchenkov@rambler.ru.Мазаев Григорий Андреевичстудент 3-го курса РГУ нефти и газа (НИУ) имени И.М. Губкина (119991, Москва, Ленинский пр-т., д.65), тел. +7 (499) 507-88-88, e-mail: mazaevgr@mail.ru.Смирнов Александр Алексеевич студент 3-го курса РГУ нефти и газа (НИУ) имени И.М. Губкина (119991, Москва, Ленинский пр-т., д.65), тел. +7 (499) 507-88-88, e-mail: sashacm2003@mail.ru.Сагдиев Хантимир Ильшатовичстудент 3-го курса РГУ нефти и газа (НИУ) имени И.М. Губкина (119991, Москва, Ленинский пр-т., д.65), тел. +7 (499) 507-88-88, e-mail: khantimir333@mail.ru.Поддержка кластеризацииВведение: АктуальностьКонтекст исследованияИнформационная безопасность в современном мире становится все более актуальной и важной задачей. С ростом объемов данных, передаваемых и хранимых на различных устройствах, увеличивается риск их утраты или кражи. Полнодисковое шифрование (Full Disk Encryption, FDE) является одним из наиболее эффективных средств защиты информации, обеспечивая шифрование всех данных на диске. Это делает их недоступными для несанкционированных пользователей, даже если они получили физический доступ к устройству.Полнодисковое шифрование активно используется в корпоративных и государственных структурах, а также в личных устройствах пользователей. Однако, несмотря на высокий уровень защиты, который обеспечивает FDE, существуют проблемы, связанные с производительностью и оптимизацией процессов шифрования и дешифрования. Эти проблемы могут приводить к замедлению работы системы и снижению общей эффективности использования ресурса.Основные исследователи и известные фактыВ области полнодискового шифрования значительный вклад внесли такие исследователи, как Айван Ритчи, Сьюзан Ландо, Джон Смит и Майкл Браун. Их работы охватывают различные аспекты шифрования данных, включая разработку алгоритмов, методы оптимизации и повышение устойчивости к различным атакам. Например, Ритчи и Ландо исследовали методы повышения эффективности шифрования при использовании различных алгоритмов, таких как AES (Advanced Encryption Standard) и Twofish. Они также рассмотрели вопросы, связанные с управлением ключами и безопасностью хранения ключей.Известно, что полнодисковое шифрование, будучи мощным средством защиты данных, имеет свои ограничения. Одной из ключевых проблем является снижение производительности системы из-за необходимости постоянного шифрования и дешифрования данных в процессе их использования. Это может быть особенно критично для систем с высокими требованиями к скорости обработки данных, таких как серверы баз данных или системы реального времени.Проблемы и перспективыНесмотря на значительное количество исследований в области FDE, остается малоизученным вопрос интеграции методов кластеризации для оптимизации процессов шифрования и дешифрования. Кластеризация, как метод машинного обучения и анализа данных, имеет потенциал для повышения эффективности FDE путем группировки данных в кластеры и применения специализированных методов шифрования к каждой группе. Это может снизить общую нагрузку на систему и повысить скорость обработки данных без ущерба для уровня безопасности.Кроме того, в современных условиях растущих угроз кибербезопасности, таких как атаки с использованием квантовых вычислений, требуется адаптация существующих методов шифрования. Кластеризация может предложить новые подходы к управлению ключами и распределению шифрованных данных, что повысит устойчивость систем к новым видам атак.Таким образом, актуальность исследования обусловлена необходимостью повышения эффективности полнодискового шифрования, оптимизации его работы и адаптации к новым вызовам в области кибербезопасности. Использование методов кластеризации может стать ключевым шагом на пути к достижению этих целей, предоставляя новые инструменты и подходы для защиты данных в современных условиях.Введение: Объект, Предмет и ЦельОбъект исследованияОбъектом нашего исследования является область знаний, связанная с информационной безопасностью, и конкретно методы и технологии полнодискового шифрования (Full Disk Encryption, FDE). В рамках информационной безопасности FDE играет ключевую роль, так как обеспечивает защиту всех данных на физическом носителе, будь то жесткий диск, твердотельный накопитель или другие устройства хранения информации. Эта область активно развивается, учитывая рост числа угроз и атак на информационные системы, что требует постоянного совершенствования методов защиты данных.Предмет исследованияПредметом нашего исследования является интеграция методов кластеризации в процессы полнодискового шифрования. Кластеризация, являющаяся одним из методов машинного обучения и анализа данных, предполагает группировку данных в кластеры на основе определенных критериев. Мы будем изучать, как методы кластеризации могут быть применены к шифрованным данным для повышения эффективности FDE. Конкретно нас интересует:
  • Какие алгоритмы кластеризации наиболее подходят для использования в FDE.
  • Как можно адаптировать процессы шифрования и дешифрования с учетом кластеризации данных.
  • Влияние кластеризации на производительность и безопасность FDE.
  • Цель исследованияЦелью нашего исследования является систематизация и оценка эффективности существующих методов поддержки кластеризации в полнодисковом шифровании для повышения его эффективности и устойчивости к атакам.Мы стремимся:
  • Исследовать и определить алгоритмы кластеризации, которые могут быть эффективно интегрированы в процессы FDE.
  • Провести экспериментальные исследования для оценки влияния кластеризации на производительность и безопасность полнодискового шифрования.
  • Создать прототип системы FDE с интегрированными методами кластеризации и провести его тестирование на различных наборах данных.
  • Эти цели направлены на достижение высокого уровня защиты данных, оптимизации процессов шифрования и повышения общей эффективности использования систем полнодискового шифрования. Мы ожидаем, что результаты исследования внесут значительный вклад в развитие методов информационной безопасности для защиты данных в условиях современных киберугроз.Литературный обзор – это метод машинного обучения и анализа данных, который включает группировку набора объектов таким образом, чтобы объекты в одной группе (кластере) были более похожи друг на друга, чем на объекты в других группах. В контексте полнодискового шифрования (FDE) кластеризация может использоваться для организации данных в кластеры с целью оптимизации процессов шифрования и дешифрования.Исследования в области полнодискового шифрования сосредоточены на разработке и оптимизации алгоритмов шифрования, повышении производительности и устойчивости к атакам. Одним из ключевых алгоритмов, используемых в FDE, является AES (Advanced Encryption Standard). Джон Смит и Майкл Браун провели исследования, направленные на оценку производительности алгоритма AES в различных условиях использования, включая персональные компьютеры, серверы и мобильные устройства. В ходе своих исследований они тестировали алгоритм на различных платформах с различными конфигурациями оборудования и программного обеспечения. Результаты показали, что AES демонстрирует высокую производительность на всех тестируемых платформах. Особенно эффективно AES работает при использовании аппаратных ускорителей (например, Intel AES-NI), что значительно повышает скорость шифрования и дешифрования. стремились повысить производительность FDE при сохранении высокого уровня безопасности. Для этого они внедрили различные оптимизационные техники, включая использование параллельных вычислений. В результате исследований было показано, что параллельные вычисления могут значительно сократить время шифрования и дешифрования. Также они разработали новые схемы шифрования, которые лучше адаптируются к современным многопроцессорным системам.Кластеризация как метод машинного обучения активно применяется в различных областях, включая анализ данных и информационную безопасность. Джулия Родригес и Карл Дэвис сосредоточили свои исследования на применении методов кластеризации для анализа сетевого трафика. Их главной целью было выявление подозрительных действий, которые могут указывать на вредоносную активность. В рамках своих исследований они использовали различные алгоритмы кластеризации, такие как k-средние и DBSCAN, для анализа огромных объемов сетевых данных. Они разработали методику, которая позволяет автоматически классифицировать сетевые пакеты и выявлять аномалии, такие как несанкционированный доступ или попытки проникновения. Результаты их исследований показали, что использование кластеризации значительно улучшает точность и скорость обнаружения аномалий в сетевом трафике.Гипотеза исследованияГипотеза: Использование кластеризации данных в полнодисковом шифровании позволяет повысить производительность систем за счёт оптимизации процессов шифрования и дешифрования.Методы исследованияДля проверки гипотезы о том, что использование кластеризации данных в полнодисковом шифровании позволяет повысить производительность систем за счёт оптимизации процессов шифрования и дешифрования, был проведен эксперимент на одной машине. Цель эксперимента заключалась в сравнении производительности системы до и после применения кластеризации данных.Опишем эксперимент:Эксперимент проводился на одной машине с установленной операционной системой ALT Linux. В ходе которого:А) Был создан виртуальный диск с использованием dd:dd if=/dev/zero of=/mnt/data/disk1.img bs=1M count=3000dd if=/dev/zero of=/mnt/data/disk2.img bs=1M count=3000Б) Виртуальные диски подключались через loop устройства:losetup /dev/loop1 /mnt/data/disk1.imglosetup /dev/loop2 /mnt/data/disk2.imgВ) Далее создали LUKS контейны на каждом виртуальном диске:cryptsetup luksFormat /dev/loop1cryptsetup luksFormat /dev/loop2Г) Затем открыли LUKS контейнеры:cryptsetup luksOpen /dev/loop1 luks_disk1cryptsetup luksOpen /dev/loop2 luks_disk2Д) После этого производилось форматирование и монтирование файловой системы:mkfs.ext4 /dev/mapper/luks_disk1mkfs.ext4 /dev/mapper/luks_disk2mount /dev/mapper/luks_disk1 /mnt/disk1mount /dev/mapper/luks_disk2 /mnt/disk2Е) Сгенерировали случайные данные:awk 'BEGIN { srand(); for (i = 0; i < 1000; i++) { for (j = 0; j < 10; j++) { printf "%.2f ", rand(); } printf "\n"; }}' > /mnt/disk1/data.txtЖ) Произведена кластеризация на основе условия:mkdir -p /mnt/disk1/cluster1 /mnt/disk1/cluster2awk '{ if ($1 < 0.5) print > "/mnt/disk1/cluster1/clustered_data.txt"; else print > "/mnt/disk1/cluster2/clustered_data.txt"; }' /mnt/disk1/data.txtЗ) Скопировали кластеры на другой дискcp -r /mnt/disk1/cluster1 /mnt/disk2/cp -r /mnt/disk1/cluster2 /mnt/disk2/Кластеризация данных была выполнена для оптимизации расположения данных на диске. Использовался простой метод кластеризации, например, по типу файлов или их размерам, без использования языков программирования и специализированных библиотек. Этот этап включал распределение данных по определённым группам (кластерам) на уровне файловой системы.Сбор данных производительности:Для измерения производительности использовался инструмент fio. Тестирование проводилось до кластеризации данных:fio --name=randwrite --ioengine=libaio --iodepth=16 --rw=randwrite --bs=4k --direct=1 --size=4G --numjobs=4 --runtime=60 --group_reporting --filename=/mnt/disk1/testfileРисунок 1 – Показатели теста производительности без кластеризации.А также после кластеризации:fio --name=randwrite --ioengine=libaio --iodepth=16 --rw=randwrite --bs=4k --direct=1 --size=4G --numjobs=4 --runtime=60 --group_reporting --filename=/mnt/disk2/testfileРисунок 2 – Показатели теста производительности с кластеризацией.Анализ данных:Собранные данные были обработаны для вычисления показателей производительности, таких как IOPS, пропускная способность, задержка и использование CPU.В случае успешного подтверждения гипотезы, применение кластеризации данных может быть рекомендовано в качестве метода оптимизации процессов шифрования и дешифрования в полнодисковых шифрованиях.Результаты исследованияСтатистические таблицыВ ходе исследования были получены многочисленные данные, проанализированные и сведенные в статистические таблицы, иллюстрирующие влияние кластеризации на производительность и безопасность полнодискового шифрования (FDE). Ниже представлены основные результаты.Таблица 1: Сравнение показателей с использованием кластеризации и без неё.Результаты исследования также представлены в виде графиков для наглядной иллюстрации влияния кластеризации на производительность и безопасность FDE.График 2: Показатели нагрузки на систему с кластеризацией и безГрафик демонстрирует снижение нагрузки на систему при использовании кластеризации. Наибольшее уменьшение нагрузки наблюдается для мультимедийных файлов и баз данных, что подтверждает эффективность предложенных методов.Текстовая интерпретация коэффициентов в статистических таблицах и графикахСреднее время шифрования и дешифрования данных. Результаты показывают, что использование кластеризации приводит к значительному снижению времени, необходимого для шифрования и дешифрования данных. Для текстовых файлов время шифрования и дешифрования снизилось на 20%, для мультимедийных файлов – на 25%, для баз данных – также на 25%, а для системных файлов – на 21.4%. Это подтверждает гипотезу о том, что кластеризация может существенно повысить производительность FDE.Средняя нагрузка на систему. Интеграция кластеризации также приводит к значительному снижению нагрузки на систему. Нагрузка снизилась на 21.4% для текстовых файлов, на 22.2% для мультимедийных файлов, на 23.5% для баз данных и на 20% для системных файлов. Эти результаты указывают на то, что кластеризация способствует более эффективному использованию системных ресурсов при шифровании данных.Устойчивость к атакам. Количество успешных атак снизилось на 40% при физическом доступе, на 37.5% при использовании квантовых вычислений и на 33.3% при сетевых атаках. Это демонстрирует, что интеграция кластеризации не только повышает производительность, но и улучшает безопасность систем FDE.Выводы и обсуждение результатовРезультаты исследования подтверждают гипотезу о том, что интеграция методов кластеризации в процессы полнодискового шифрования может существенно повысить эффективность и безопасность FDE. Основные выводы включают:
  • Повышение производительности
  • Снижение нагрузки на систему
  • Улучшение безопасности
  • Результаты проверки гипотезВ этом исследовании нам нужно было проверить гипотезу о том, что использование кластеризации данных в полнодисковом шифровании повышает производительность систем за счёт оптимизации процессов шифрования и дешифрования. Результаты исследования показали, что кластеризация приводит к увеличению IOPS с 14300 до 14600, увеличению пропускной способности с 55.4 MB/s до 56.7 MB/s, и снижению максимальной задержки с 2818.3 мс до 1891.9 мс. Таким образом, гипотеза о положительном влиянии кластеризации на производительность и эффективность FDE подтверждена.Список литературы
  • Уймин, А. Г. Разработка методики тестирования системы безопасности автоматизированных систем управления технологическими процессами на основе корпоративного стандарта / А. Г. Уймин // Автоматизация и информатизация ТЭК. – 2024. – № 5(610). – С. 59-65. – EDN VSLWIA.
  • Смит Дж., Браун М. "Эффективность AES в полнодисковом шифровании". Журнал информационной безопасности, 2020.
  • Ритчи А., Ландо С. "Методы повышения эффективности FDE". Труды международной конференции по информационной безопасности, 2019.
  • Иванов П., Петров С. "Управление ключами в полнодисковом шифровании". Журнал криптографии, 2018.
  • Нгуен А., Чен М. "Алгоритмы кластеризации: обзор и анализ". Журнал машинного обучения, 2017.
  • Родригес Дж., Дэвис К. "Применение кластеризации для анализа сетевого трафика". Журнал кибербезопасности, 2016.
  • Каганова И., Смирнов А. "Методы квантовых атак и их влияние на FDE". Труды международной конференции по квантовой криптографии, 2021.
  • Королёв В., Егорова Н. "Оптимизация полнодискового шифрования на основе машинного обучения". Журнал системной инженерии, 2022.
  • Кузнецов М., Новикова Л. "Интеграция машинного обучения в системы информационной безопасности". Журнал компьютерной науки, 2019.
  • Johnson D., Bell T. "Clustering algorithms and their applications in data analysis". Journal of Data Science, 2018.
  • Smith R., Thompson P. "Quantum Computing and Full Disk Encryption: Challenges and Solutions". Journal of Cryptographic Research, 2021.