background top icon
background center wave icon
background filled rhombus icon
background two lines icon
background stroke rhombus icon

Скачать "Python Импорт данных №1. Импорт Excel"

input logo icon
Теги видео
|

Теги видео

Power Query
Excel
Обучение Excel
Обучение Power Query
Уроки Excel
Уроки Power Query
Курсы Excel
Курсы Power Query
Excel Power Query
Excel Power Pivot
Курсы Power Pivot
Обучение Power Pivot
Субтитры
|

Субтитры

subtitles menu arrow
  • enАнглийский
Скачать
00:00:00
[музыка]
00:00:03
добро пожаловать на канал товарищ их
00:00:05
цель меня зовут тимур
00:00:07
продолжаем курс python для аналитиков
00:00:09
модуль импорт и сегодня мы будем
00:00:11
портировать таблицы из файла microsoft
00:00:14
excel
00:00:15
перед вами книга таблицу с которой мы
00:00:18
будем импортировать
00:00:19
но помимо того что мы просто импортируем
00:00:21
данные нам нужно сначала эти данный
00:00:24
почистить во-первых мы удалим лишнее
00:00:26
строки сверху а во-вторых самый первый
00:00:29
столбец посмотрите это столбец а который
00:00:32
я выделил нам нужно его разделить на две
00:00:34
части в одной части у нас должен
00:00:36
находиться а адрес другой номер операции прежде чем
00:00:40
начать я хочу поблагодарить всех
00:00:41
спонсоров канала за поддержку если вы
00:00:43
хотите поддержать канал то вы можете
00:00:45
тоже стать спонсором канала а спонсоры
00:00:48
также получают некоторые бонусы например
00:00:50
приложенный файл к урокам
00:00:52
чтобы не только смотреть но и повторять
00:00:54
за мной то есть практиковаться запустите
00:00:57
юпитер ноутбук и откройте ноутбук с
00:01:00
префиксом старт в названии
00:01:02
переходим в первую ячейку и сначала нам
00:01:04
понадобится импортировать модули с
00:01:06
помощью которых мы будем решать данную
00:01:08
задачу во-первых нам понадобится модуль
00:01:11
pandas во вторых нам понадобится
00:01:12
модульном пай мы нажимаем control enter
00:01:15
для того чтобы запустить ячейку и
00:01:17
переходим в следующую заготовленную
00:01:19
ячейку как видите я написал что в этой
00:01:22
ячейке мы будем читать
00:01:24
xlsx файл для этого нам понадобится
00:01:27
команда модуля pandas riddex л.и.
00:01:30
полученный результат мы запишем в
00:01:32
переменную дейта в этой перемены на
00:01:33
самом деле очень много возможных
00:01:35
параметров но самый главный и
00:01:37
обязательный это естественно сам файл
00:01:39
который мы будем читать и наш файл
00:01:41
называется дэйтасет .
00:01:43
xlsx теперь я предлагаю использовать в
00:01:46
этой функции еще и параметр с кипра us
00:01:48
для того чтобы пропустить несколько
00:01:50
верхних ненужных строк давайте еще раз
00:01:53
посмотрим на наш исходный файл и
00:01:55
посчитаем сколько строк нам нужно
00:01:57
пропустить
00:01:58
у нас сверху раз два три 4 5 ненужных
00:02:01
строк соответственно у параметр с кипра
00:02:03
значение будет пять и так же прямо здесь
00:02:06
я предлагаю использовать еще один
00:02:07
необязательный параметр это параметр you
00:02:09
сколз при помощи этого параметра мы
00:02:12
указываем к ки столбцы мы хотим использовать еще раз
00:02:15
посмотрим на наш приложенный файл и наши
00:02:18
таблицы находится в столбцах а тире эйч
00:02:21
соответственно именно эти столбцы мы
00:02:23
будем использовать у параметры дисков
00:02:25
будет значение эй : эй нажимаем control
00:02:28
enter для того чтобы запустить ячейку и
00:02:31
переходим к следующей сейчас мы будем
00:02:33
делить самый первый столбец столбец
00:02:36
номер операции как видите у нас здесь
00:02:38
все перемешано
00:02:40
здесь у нас и данные об адресе торговой
00:02:42
точки и сам номер операции во первых
00:02:45
давайте для начала получим адрес в
00:02:47
отдельном столбце
00:02:48
для этого нам понадобится из первого
00:02:51
столбца извлечь все что находится после
00:02:54
запятой но здесь нам пригодится условная
00:02:56
формула какое здесь будет условия если
00:02:59
ячейка начинается символов поз то в
00:03:02
таком случае мы хотим извлечь все что
00:03:04
находится после первой запятой в
00:03:06
противном случае хотим получить значение
00:03:08
нал
00:03:09
для того чтобы ввести такое условие нам
00:03:11
понадобится команда в
00:03:13
из модуля нам пай возвращаемся в юпитер
00:03:16
ноутбук и так как мы хотим добавить
00:03:18
новый столбец под названием адрес то
00:03:21
давайте так и напишем
00:03:22
сошлемся сначала на наш dataframe дейта
00:03:25
на столбец адрес как я уже сказал нам
00:03:28
понадобится команда в
00:03:30
из модуля нам пай первый параметр этой
00:03:33
функции это условие в условии мы
00:03:36
проверим начинается ли значение и
00:03:38
столбца номер операции символов поз
00:03:41
следующем параметре мы должны уже
00:03:42
указать что именно получится если
00:03:45
условие истинно точно также сначала
00:03:47
сошлемся на столбец номер операция далее
00:03:51
нам понадобится воспользоваться команды
00:03:53
стер сплит для того чтобы разделить
00:03:55
текстовую строку по запятой у команды
00:03:58
сплит два основных параметра первый
00:04:01
параметр это разделитель в нашем случае
00:04:03
это , во втором параметры нам нужно
00:04:05
указать сколько разделители мы хотим
00:04:07
применить и так как мы хотим разделить
00:04:09
только по первой запятой то указываем
00:04:11
параметр n со значением 1 и далее после
00:04:14
точки нам нужно указать какую именно
00:04:17
часть этой строки разделенный мы хотим
00:04:20
получить первую или вторую то есть мы
00:04:21
разделили получается строку на две части
00:04:23
в первой части у нас находится все
00:04:26
до адреса и во второй части у нас
00:04:28
находится сам адрес соответственно нам
00:04:30
нужно 2 часть
00:04:31
а yandex или второй части единицы потому
00:04:34
что нумерация начинается с 0
00:04:36
и третий параметр что будет если условие
00:04:39
истинно и нашем случае мы хотим чтобы
00:04:41
получилось значение на
00:04:42
ещё раз вернёмся в предыдущюю строчку
00:04:45
здесь нам еще перед квадратной скобкой
00:04:47
нужно ввести с tear
00:04:49
нажимаем control enter и ячейка
00:04:51
выполняется давайте посмотрим что у нас
00:04:53
получилось
00:04:54
сошлемся на dataframe под названием
00:04:57
дейта и допустим получим первые три
00:05:00
строчки нажимаем control enter и у нас
00:05:02
как видите получился столбец адрес
00:05:05
которым мы видим адрес теперь давайте
00:05:07
создадим столбец пост айди условия будет
00:05:11
очень похоже если
00:05:12
столбце номер операции у нас строка
00:05:14
начинается с букв пост то в таком случае
00:05:17
мы хотим получить значение между 1 и 2
00:05:21
скобкой точно также давайте посмотрим
00:05:23
что у нас получается нажимаем control
00:05:25
enter и у нас получился еще один столбец
00:05:27
с названием по сойди как видите в обоих
00:05:30
случаях и в столбце адрес и встал топаз
00:05:33
иди у нас очень много значений нам
00:05:36
поэтому не помешало бы чтобы ситуацию
00:05:39
исправить давайте заполним значения вниз
00:05:42
переходим следующий очень по которой
00:05:44
называется заполнить вниз нам
00:05:46
понадобится сначала переназначить
00:05:48
столбец адрес ссылаемся на dataframe
00:05:51
дейта на столбец адрес присваиваем ему новые
00:05:55
значения во первых он будет точно такой
00:05:58
же как и столбец
00:05:59
адрес но мы хотим заполнить значение
00:06:02
вниз для этого используем команду f фил
00:06:04
что означает форвард фил то есть
00:06:06
заполнить вперед далее мы можем
00:06:08
скопировать эту же строчку и вместо
00:06:11
адреса
00:06:12
написать название столбца по сойди
00:06:15
теперь посмотрим что у нас получилось
00:06:18
ссылаемся на dataframe под названием
00:06:20
даты давайте посмотрим первые десять
00:06:22
строчек нажимаем control enter и вот что
00:06:25
у нас получается данные в столбцах
00:06:27
адрес и посади заполнились вниз и теперь
00:06:31
нам нужно избавиться от лишних строк
00:06:33
посмотрите сейчас на столбец например
00:06:35
дата операции
00:06:37
каждый раз когда в столбце номер
00:06:39
операции у нас дата
00:06:40
вместо номера операции во всех остальных
00:06:43
столбцах значения нан или над
00:06:45
соответственно мы можем отфильтровать
00:06:47
строки в том случае если например в
00:06:50
столбце дат операции находится над
00:06:53
перейдем следующую ячейку и удалим все
00:06:56
вот такие вот на лавы и значения по
00:06:58
столбцу дата операции для этого нам надо
00:07:01
переназначить переменную дельтав который
00:07:03
у нас находится dataframe ссылаемся
00:07:06
снова на столбец дейт и для того чтобы
00:07:08
его отфильтровать мы в квадратных
00:07:10
скобках вводим условия по которым мы
00:07:12
будем фильтровать во-первых мы хотим
00:07:14
фильтровать по столбцу дата операции и
00:07:17
применяем метод not null
00:07:20
давайте сразу перейдем на следующую
00:07:22
строчку и посмотрим что получается точно
00:07:25
так же выводим первые три строчки жмем
00:07:27
control enter и как видите у нас такие
00:07:30
значения исчезли теперь давайте для
00:07:32
столбцов 90 ходится номера операции и
00:07:35
посадил укажем числовой тип данных а
00:07:38
именно целое число во-первых давайте
00:07:40
посмотрим какие типы данных у нас сейчас
00:07:42
ссылаемся на dataframe дельта .
00:07:46
где types для того чтобы посмотреть типы
00:07:48
данных жмем control enter смотрим что
00:07:51
получается и видите для столбцов по
00:07:53
сойди у нас тип данных об джек и для
00:07:56
столбца
00:07:57
номер операции у нас тоже тип данных
00:08:00
объект изменим их на
00:08:02
интеджер точно также ссылаемся на
00:08:04
столбец дейта для того чтобы назначить
00:08:08
новый тип данных у нас есть команда
00:08:10
s-type и для того чтобы для выбранных
00:08:13
столбцов указать определенные типы
00:08:15
данных мы используем славой ключами у
00:08:18
этого словаря будут названия столбцов
00:08:20
вводим первое название номер операция
00:08:24
значениями в словаре будут типы данных
00:08:27
тип данных у нас интеджер то есть int
00:08:30
жмем control and чтобы выполнить ячейку
00:08:33
и давайте в следующей ячейке ещё раз
00:08:36
посмотрим какие теперь типы данных и как
00:08:38
видите теперь у столбца номер операции и
00:08:41
у столбца по сойди
00:08:43
тип данных integer переходим в следующую
00:08:46
ячейку и здесь мы хотим записать
00:08:48
получившийся dataframe
00:08:50
книгу excel я здесь уже все заполнил
00:08:53
нажимаю control enter перехожу в рабочую
00:08:57
папку здесь появляется книга excel с
00:09:00
названием транзак шанс открываю эту
00:09:02
книгу у нас получается почти такой же
00:09:03
как был раньше но в отличие от того
00:09:06
файла он не содержит ничего лишнего на
00:09:09
этом на сегодня все и до новых встреч

Описание:

Научимся импортировать данные из книг MS Excel в формате xlsx. Файлы для спонсоров Boosty: https://boosty.to/comrade-xl/posts/8b0e3d90-7da1-4bdc-b0e6-30256993073b?share=post_link Файлы для спонсоров ВК: https://vk.com/comrade.excel?w=wall-185123800_463 Файлы для спонсоров YouTube: https://www.youtube.com/post/UgzHwArqX60DeL0Swl54AaABCQ Индивидуальное обучение: https://comrade-xl.ru/pq-training/ Страница: https://comrade-xl.ru/2021/04/30/py-import-excel-xlsx/

Готовим варианты загрузки

popular icon
Популярные
hd icon
HD видео
audio icon
Только звук
total icon
Все форматы
* — Если видео проигрывается в новой вкладке, перейдите в неё, а затем кликните по видео правой кнопкой мыши и выберите пункт "Сохранить видео как..."
** — Ссылка предназначенная для онлайн воспроизведения в специализированных плеерах

Вопросы о скачивании видео

mobile menu iconКак можно скачать видео "Python Импорт данных №1. Импорт Excel"?mobile menu icon

  • Сайт http://unidownloader.com/ — лучший способ скачать видео или отдельно аудиодорожку, если хочется обойтись без установки программ и расширений. Расширение UDL Helper — удобная кнопка, которая органично встраивается на сайты YouTube, Instagram и OK.ru для быстрого скачивания контента.

  • Программа UDL Client (для Windows) — самое мощное решение, поддерживающее более 900 сайтов, социальных сетей и видеохостингов, а также любое качество видео, которое доступно в источнике.

  • UDL Lite — представляет собой удобный доступ к сайту с мобильного устройства. С его помощью вы можете легко скачивать видео прямо на смартфон.

mobile menu iconКакой формат видео "Python Импорт данных №1. Импорт Excel" выбрать?mobile menu icon

  • Наилучшее качество имеют форматы FullHD (1080p), 2K (1440p), 4K (2160p) и 8K (4320p). Чем больше разрешение вашего экрана, тем выше должно быть качество видео. Однако следует учесть и другие факторы: скорость скачивания, количество свободного места, а также производительность устройства при воспроизведении.

mobile menu iconПочему компьютер зависает при загрузке видео "Python Импорт данных №1. Импорт Excel"?mobile menu icon

  • Полностью зависать браузер/компьютер не должен! Если это произошло, просьба сообщить об этом, указав ссылку на видео. Иногда видео нельзя скачать напрямую в подходящем формате, поэтому мы добавили возможность конвертации файла в нужный формат. В отдельных случаях этот процесс может активно использовать ресурсы компьютера.

mobile menu iconКак скачать видео "Python Импорт данных №1. Импорт Excel" на телефон?mobile menu icon

  • Вы можете скачать видео на свой смартфон с помощью сайта или pwa-приложения UDL Lite. Также есть возможность отправить ссылку на скачивание через QR-код с помощью расширения UDL Helper.

mobile menu iconКак скачать аудиодорожку (музыку) в MP3 "Python Импорт данных №1. Импорт Excel"?mobile menu icon

  • Самый удобный способ — воспользоваться программой UDL Client, которая поддерживает конвертацию видео в формат MP3. В некоторых случаях MP3 можно скачать и через расширение UDL Helper.

mobile menu iconКак сохранить кадр из видео "Python Импорт данных №1. Импорт Excel"?mobile menu icon

  • Эта функция доступна в расширении UDL Helper. Убедитесь, что в настройках отмечен пункт «Отображать кнопку сохранения скриншота из видео». В правом нижнем углу плеера левее иконки «Настройки» должна появиться иконка камеры, по нажатию на которую текущий кадр из видео будет сохранён на ваш компьютер в формате JPEG.

mobile menu iconСколько это всё стоит?mobile menu icon

  • Нисколько. Наши сервисы абсолютно бесплатны для всех пользователей. Здесь нет PRO подписок, нет ограничений на количество или максимальную длину скачиваемого видео.