IT в банковской сфере — это область, где существует множество рисков. Большинство из них связаны с высоконагруженными системами управления базами данных. Банковские IT-специалисты должны быть очень изобретательными, чтобы обеспечить бесперебойную работу таких систем.
Один из таких специалистов — Виталий Лещук, руководитель IT-инфраструктуры процессингового центра в Тинькофф Банке. Более шести лет он посвятил решению проблем с производительностью и надежностью высоконагруженных систем в банковской сфере. За это время Виталий не только создал отдел инфраструктуры с нуля, но и разработал уникальную методологию, которая позволяет значительно повысить эффективность работы с базами данных и минимизировать риски сбоев.
Виталий поделился своими знаниями о том, какие решения он внедрил, чтобы минимизировать риски от нештатной работы систем.
«СП»: Виталий, как технический специалист с глубокой экспертизой в области высоконагруженных финтех-систем, расскажите, пожалуйста, о вашем образовательном и карьерном пути. Где начиналась ваша профессиональная деятельность?
— Я окончил МИФИ по специальности «Прикладная математика и информатика». МИФИ дал мне фундаментальные знания в области математики, программирования и алгоритмов. МИФИ — это, знаете, как космодром для ума. Там тебя заряжают фундаментальными знаниями по математике, программированию и алгоритмам, чтобы ты потом мог создавать свои собственные ракеты, только в IT-сфере. Эти знания стали прочной основой для моего дальнейшего профессионального развития в IT-сфере.
Уже на 4 курсе меня пригласили на стажировку в BPC Banking Technologies, одну из ведущих компаний в сфере финтеха. Помню, как мы с ребятами сидели за полночь над задачами, строили алгоритмы и дебатировали о разных подходах. Такое соревновательное окружение заставляет тебя выжимать максимум из себя, и это безумно полезно.
А еще МИФИ дал мне нечто больше, чем просто знания. Он заложил в меня любовь к творчеству, к решению проблем, к поиску нестандартных подходов. И это не менее важно, чем технические знания, потому что именно это позволяет мне быть настоящим IT-специалистом.
«СП»: Это явно было очень интересно, ведь финтех — это динамичная и перспективная область. Расскажите, что вас привлекло в BPC?
— Да, финтех действительно захватил мое воображение! BPC предлагал возможность погрузиться в мир инновационных банковских технологий, что было очень привлекательно. Я хотел применить свои знания в практике и увидеть, как они работают в реальном мире. В BPC я получил ценный опыт, но затем меня привлекло предложение от Тинькофф Банка. Это была возможность работать в молодой и динамичной компании, которая быстро развивается. Я пришел в Тинькофф в качестве инженера, и за несколько лет мой карьерный рост стал настолько динамичным, что мне было тяжело это представить.
«СП»: Виталий, сегодня вы — опытный технический лидер, занимающий руководящую должность в ведущих IT-компаниях. Расскажите, пожалуйста, подробнее о том, как вы продолжили свое профессиональное развитие и расширяли свои компетенции в этой сфере.
— Дальнейшее развитие? Это как бесконечный горизонт, где ты постоянно ищешь новые звезды! В IT-сфере нельзя стоять на месте, иначе рискуешь остаться в хвосте. Но самое важное для меня — это не просто личное развитие, а создание банковских инструментов, которые будут шагать в ногу со временем. Поэтому я с удовольствием расскажу о нашей системе развития. Мы создали «карту здоровья» — инструмент, который позволяет быстро определить и устранить «болезни» в работе высоконагруженных банковских систем. Представьте, что ваш код — это живой организм, и «карта здоровья» — это ваш личный врач, который моментально диагностирует проблему и дает рекомендации по лечению.
Я горжусь тем, что нам удалось сделать эту систему действительно эффективной. Она позволяет нам предотвращать сбои, ускорять разработку и поддерживать наши системы в отличном состоянии. А это значит, что мы можем предоставлять нашим клиентам лучшие услуги и решения.
«СП»: Вы спроектировали и внедрили инновационную платформу автоматизации для управления высоконагруженными банковскими системами. Расскажите подробнее о ее возможностях. Как она помогает кредитным учреждениям?
— Если сильно не вдаваться в технические детали, то можно сказать, что мы создали эффективный dashboard («приборная панель» — инструмент для визуализации данных, которые автоматически загружаются из других систем). Когда дежурный сотрудник замечает, что скорость процессов замедляется, он открывает эту «карту», где обозначена конкретная проблема и её местоположение. Затем он следует инструкциям и исправляет сбой.
Dashboard постоянно обновляется: если возникает проблема, которой нет в наших скриптах, специалисты анализируют её и дополняют карту. Сегодня любой сотрудник, даже с базовыми знаниями, может разобраться с большинством проблем производительности, используя инструменты «карты здоровья», мониторинга и статей в базе знаний. Это значительно сокращает время и усилия, затрачиваемые на исправление ошибок, и, как следствие, снижает риски при проведении транзакций и других операций.
В заключение хочу подчеркнуть, что проблема высоконагруженных систем не может быть решена только аппаратными методами. Разработанная нами методология подразумевает прежде всего максимальную функциональность каждого участника технической поддержки и оптимальное распределение ресурсов. Только в этом случае банк будет работать бесперебойно, без потерь, а клиенты останутся довольны обслуживанием и работой банка.
«СП»: Виталий, вы более 10 лет работаете в банковской сфере и хорошо разбираетесь в работе высоконагруженных систем. Хотелось бы узнать, насколько серьезными могут быть последствия сбоев в таких системах?
— Лучше всего обратиться к экспертным данным. Например, компания Schneider Electric установила, что минута транзакций по трейдинговым операциям в одном из ведущих российских банков стоит от 10 до 20 тысяч долларов. Если происходит сбой на сервере или в системе хранения данных, то восстановление может занять от двух часов, и банк может потерять от 200 до 300 тысяч долларов.
Проблемы с транзакциями также могут привести к потерям для клиентов, которые получают или переводят деньги с опозданием. Это может иметь негативные последствия для репутации банка.
Специалисты, работающие с высоконагруженными системами, часто допускают типичные ошибки, такие как недостаточная оптимизация баз данных, неэффективное использование кэша, неправильная масштабируемость, неадекватное тестирование нагрузки и пренебрежение отказоустойчивостью.
Особенно важно учитывать отказоустойчивость при проектировании высоконагруженных сервисов, чтобы они продолжали работать при возникновении локальных отказов. Именно на решение этой стратегической задачи была направлена моя разработка.
«СП»: Вы разработали собственную методологию, которая позволяет эффективно решать проблемы с задержкой и сбоями в банковских транзакциях. Расскажите, с какими трудностями вам пришлось столкнуться? Как вы решали эти проблемы?
— С проблемами сбоев мы столкнулись еще во времена моей работы инженером. Количество клиентов банка значительно возросло, как и количество операций — не только транзакций, но и операций по выпуску и перевыпуску карт, работе внешних сервисов и других услуг. В прошлом году компания Oracle, которая ранее поставляла решения для работы с большими массивами данных, окончательно ушла из России. А системы типа PostgreSQL не всегда эффективно справляются с такими масштабными задачами.
Ещё одна серьёзная проблема — это кадры. Специалистам техподдержки приходится работать круглосуточно, что приводит к быстрому выгоранию и уходу ценных сотрудников. Из-за этого, даже если сама система обеспечения процессинга будет очень хорошей, ее может быть некому поддерживать.
Мне пришлось решать обе эти проблемы одновременно. Я предложил создать отдельное инфраструктурное подразделение, основной задачей которого было бы обслуживание высоконагруженных систем. Отдел был создан с нуля, и здесь я впервые реализовал свою идею, которая до сих пор не так часто применяется: разделение функций между опытными специалистами и начинающими. Мы называем их «джуниорами».
Проще говоря, опытные специалисты пишут инструкции на все возможные случаи, а начинающие дежурят и при малейших признаках проблем с системой следуют заранее разработанному алгоритму действий. Для этого мы разработали аппаратную методику, которую пришлось создавать дважды: сначала для Oracle, а затем для PostgreSQL.
«СП»: Виталий, учитывая ваш многолетний опыт работы в качестве ведущего технического специалиста в ведущих финтех-компаниях, какие основные тенденции развития вы наблюдаете в этой сфере на сегодняшний день?
— Исходя из моего опыта работы ведущим техническим специалистом в передовых финтех-компаниях, я наблюдаю устойчивую тенденцию к сближению банковского и IТ-секторов. Если раньше банковские учреждения в основном выступали заказчиками сторонних IT-разработок, то теперь мы видим, как их собственные цифровые подразделения становятся полноценными партнерами и даже частью общей организационной структуры.
Многие крупные банки начинают выделять собственные вычислительные мощности, серверные и сетевые ресурсы для реализации стратегически важных IT-проектов. Это позволяет им оперативнее внедрять инновации, быстрее адаптировать свои системы к меняющимся потребностям рынка и клиентов. В свою очередь IТ-компании получают более глубокое понимание специфики банковской отрасли, что дает им возможность разрабатывать более релевантные и эффективные решения. Наша платформа автоматизации управления высоконагруженными банковскими системами как раз является примером такой плодотворной интеграции.
В целом, я считаю, что это взаимовыгодное сближение двух секторов экономики открывает широкие перспективы для дальнейшего развития финтех-индустрии. Оно позволяет нам создавать инновационные решения, повышающие качество и надежность финансовых сервисов.
24 мая 2024 г.
Об эксперте. Виталий Лещук окончил МИФИ по специальности «Прикладная математика и информатика». Уже на 4 курсе был приглашен на стажировку в BPC Banking technologies — один из лидеров финтеха. По окончании института пришел на работу в Тинькофф-банк в качестве инженера. Сегодня — руководитель IT-инфраструктуры процессингового центра, SRE-инженер.