Эта статья расскажет вам о функциях, в том числе о том, что они собой представляют, их синтаксисе, компонентах и типах. Вы также узнаете, как написать функцию Python.
Деревья решений просты и легко объяснимы. Они могут быть легко отображены графически и следовательно, допускают гораздо более простую интерпретацию. Они также являются довольно популярным и успешным оружием, когда речь идет о соревнованиях по машинному обучению (например Kaggle).
Однако простота на первый взгляд не означает, что алгоритм и лежащие в его основе механизмы скучны или даже тривиальны.
В следующих разделах мы собираемся поэтапно реализовать дерево решений для классификации, используя только Python и NumPy. Мы также узнаем о концепциях энтропии и получения информации, которые дают нам средства для оценки возможных расщеплений, что позволяет нам разумно вырастить дерево решений.
Но прежде чем погрузиться непосредственно в детали реализации, давайте установим некоторые базовые интуитивные представления о деревьях решений в целом.
Данные реального мира беспорядочны. Мы часто получаем данные из нескольких источников с разным форматом именования столбцов, и их стандартизация может быть проблемой. Несмотря на проблему, по-прежнему важно стандартизировать имена столбцов в общем формате на ранней стадии процесса очистки данных, чтобы облегчить последующие задачи. Регулярное выражение обычно используется для очистки запутанных имен столбцов, однако может быть довольно утомительно писать регулярное выражение для покрытия различных запутанных сценариев. В этот момент входит Skimpy.
Python предоставляет пакет Abstract Base Class (ABC) для облегчения реализации абстрактных классов, и по понятным причинам этот модуль называется abc
. Абстрактные классы позволяют разработчикам создавать схемы для подклассов, чтобы они имели определенное поведение, поэтому давайте посмотрим, как мы это делаем на примере использования из обычного сценария обработки данных…
Каждый начинающий программист любит циклы for из-за их полезности и простоты понимания. Точно так же все любят массивы. Однако чаще всего мы начинаем использовать массивы для всего, даже не задумываясь. Мы ходим на занятия по структурам данных, но когда дело доходит до практики того, что мы узнали, мы не успеваем. Только недавно я поймал себя на том, что попал в эту ловушку. Я работал над задачей программирования, пытаясь заставить себя писать эффективный и быстрый код.
Мы можем сделать лучше!
Очевидно, что большая часть мира решила, что они хотят использовать JSON для своих общедоступных конечных точек API. Однако большую часть времени вам придется иметь дело с механизмами хранения, которые не очень хорошо работают с JSON. Это может привести к путанице, потому что вам нужно вставить квадратный колышек в круглое отверстие.
Python lambdas - это небольшие, анонимные, суб-синтаксические работы, которые более ограничены, но короче, чем обычные функции Python.
В программировании рекурсия является фундаментальным понятием. В большинстве собеседований по Python могут задать вопрос на эту тему. Независимо от того, являетесь ли вы программистом или специалистом по обработке данных, эту концепцию должен знать каждый. Рекурсивны не только алгоритмы поиска и сортировки, но и каждое собеседование по Python будет включать некоторые вопросы, основанные на рекурсии. Это делает рекурсию ключевой концепцией, которую нужно пересматривать перед любым собеседованием по программированию.
Предупреждение: эта публикация не является рекомендацией инвестировать или не инвестировать в биткойны, если вы хотите узнать о ней больше, поищите сертифицированного специалиста с опытом работы в этой области, пожалуйста!
Мотивация: я изучал временные ряды и, увидев простоту использования библиотеки Python для анализа временных рядов, fbprophet, я решил применить его к набору данных, через LinkedIn я получил новость о том, что виртуальная валюта биткойн имеет значение 100 тысяч, и это заставило меня подумать, используя fbprophet, какова будет стоимость этой валюты через год?
Метод Python String casefold() используется для реализации сопоставления строк без регистра. Сворачивание регистра похоже на использование нижнего регистра, но более агрессивно, потому что функция casefold()
более агрессивна, поскольку она преобразует все строковые символы в строчные. Она предназначена для удаления всех различий в регистре в строке.
Python - высокоуровневый язык программирования созданный Гвидо ван Россумом еще в 1980 году. Мощный, одновременно поддерживающий несколько парадигм программирования, на сегодняшний день используется во многих сферах деятельности, от программирования микроконтроллеров и до создания сложных микросервисных веб приложений.
Присоединяйся в тусовку
Поделитесь своим опытом, расскажите о новом инструменте, библиотеке или фреймворке. Для этого не обязательно становится постоянным автором.