Как пакет, разработанный сообществом, определяет машинное обучение

Sk learn, или Scikit-Learn - это модуль Python, который не нуждается в представлении. Sklearn не только изменил весь язык и экосистему Python, но и машинное обучение в целом. По данным HugoVk, который цитирует свои источники как

  • Сам PyPi
  • Колеса Python
  • Google BigQuery
  • Пипинфо,

(вы можете просмотреть его сайт здесь)



Scikit-Learn - 62-й по величине пакет Python по скачиванию через Pip. Это может показаться не таким значительным, пока вы не учитываете тот факт, что Python изначально определенно не был создан для машинного обучения, а Sklearn создан именно для этого. Для сравнения, Numpy, пакет Python, обычно связанный с линейной алгеброй в Python, имеет номер 23. Pandas, пакет для управления большими объемами данных во фреймах данных, имеет номер 38. IPython отстает от Sklearn и занимает первое место. номер 76. Это фактически означает, что больше людей скачали Sklearn, чем использовали Jupyter Notebooks с Python. Это утверждение, вероятно, будет опровергнуто, если принять во внимание одну вещь:

Серверы

Краткая история

Sklearn был первоначально создан Дэвидом Курнапо как проект «Google Summer Of Code» в соответствии с новой лицензией на распространение программного обеспечения Беркли в июне 2007 года. Название Scikit происходит от сочетания двух терминов:

Сципи и Кит.

Набор для Scipy не требует пояснений, но совершенно очевидно, что Sklearn вышел далеко за рамки простого набора инструментов для Scipy. Это было сделано целым списком разработчиков в 2010 году, Фабиан Педрегоса, Гаэль Вароко, Александр Грамфор и Винсент Мишель, все из Французского института исследований в области компьютерных наук и автоматизации.

Изменение Python

Не секрет, что за последние годы популярные части экосистемы Python резко изменились, и все это отчасти связано с проектом Курнапо «Summer Of Code». Влияние фантастической кодовой базы Sklearn на язык программирования Python в целом неизмеримо. Sklearn, а также библиотека машинного обучения Google с открытым исходным кодом Tensorflow работали над созданием доминирующей и сильной экосистемы внутри языка Python, которой с тех пор так и не пришлось столкнуться. Даже в гораздо более новом языке, Julia, PyCall Sklearn часто упаковывается для выполнения определенных задач.

Машинное обучение - самая популярная технология в Python прямо сейчас, как и во всем мире. И в мире, который движется в сторону автоматизации, одновременно захватывающе и потрясающе, что Python стал доминирующей силой, движущей этим новым расширением. В сам язык программирования Python внесено множество обновлений, чтобы подавить предложения только инженеров машинного обучения. Трудно спорить с перспективой машинного обучения как для улучшения, так и для формирования всего языка в соответствии с его потребностями.

Изменение машинного обучения

Если вы какое-то время работали в области науки о данных, вам не нужно было иметь ни глаз, ни ушей, чтобы не заметить, что другие модули черпали вдохновение непосредственно из Sklearn. Фактически, при написании модулей машинного обучения Python существует целая концепция, которая называется

Соответствие SkLearn

Большинство модулей машинного обучения, даже включая Tensorflow, созданы с учетом этой методологии. «Примерка» модели сама по себе стала целым определением, и все это благодаря замечательной работе, проделанной в SkLearn. Вся экосистема Data-Science вращается вокруг хорошо разработанных и заслуживающих уважения инструментов, содержащихся в SkLearn. Не только это, но и постоянно растущее число алгоритмов машинного обучения, развернутых по протоколу HTTP, также зависит от SkLearn.

Изменение экосистемы

Было затронуто, что SkLearn был гораздо менее популярным, чем Numpy, с точки зрения загрузки пользователями через Pip, но другой, который был помещен намного выше SkLearn, был Scipy. Scipy, вероятно, является самой большой зависимостью от Sklearn, поэтому название было основано именно на этом. SkLearn сделал эти инструменты еще более известными в науке о данных, чем они уже представляли.

Популярность Pandas и Numpy, вероятно, очень коррелирована, или на жаргоне Data Scientist;

«Вернет очень низкое значение P»

а SkLearn и Scipy являются прямой аналогией этих двух пакетов. SkLearn был построен с учетом Scipy, так же как Pandas был построен с учетом Numpy. SkLearn полностью изменил экосистему Python, сделав Scipy гораздо более популярным пакетом, просто будучи зависимостью.

Заключение

Излишне говорить, что SkLearn, безусловно, оставил свой след в машинном обучении, Python, информатике, а также в автоматизации, и очень маловероятно, что в ближайшее время он куда-нибудь придет. SkLearn - единственный пакет машинного обучения из ста лучших пакетов Python, который занимает довольно значительное место, если принять во внимание цифры.

SkLearn не только повлиял на способ написания моделей, но и открыл новые возможности в Python для машинного обучения, придавая форму языку и экосистеме, которые вращаются вокруг него, по крайней мере, в некоторой степени. Все это делает влияние SkLearn на науку, машинное обучение и автоматизацию чрезвычайно изысканным и значительным. SkLearn - это модуль, который начал свою жизнь как проект, совместно организованный Google.

Как и в случае со многими пакетами с открытым исходным кодом, замечательное сообщество программистов с открытым исходным кодом и фанатиков GNU смогло сделать из него гораздо больше, чем когда-либо могло быть проприетарное решение. Вся тяжелая работа, которую сопровождающие проделывали в течение многих лет после этого, действительно окупилась и сделала машинное обучение Python основным продуктом языка программирования Python, и я искренне надеюсь, что это никогда не изменится.