Questions tagged [pandas]

Pandas — пакет для анализа данных на Python. Дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным, а при наличии пакета matplotlib дает возможность рисовать графики на полученных наборах данных.

Pandas (PANel DAta) - это библиотека для работы с многомерными таблицами и наборами данных, обычно встречающихся в статистике, экспериментальных научных результатах, эконометрике или финансах. Pandas реализуется в основном с использованием и . Имется возможность легко интегрироваться с другими научными библиотеками на основе NumPy, например, statsmodels.

Ссылки

3180 questions
2
votes
1 answer

Pandas. Сортировка строк по двум условиям

Хотел бы вывести таблицу чтобы данные удовлетворяли двум условиям. Строки в который в Столбце "СчетДт" == 10,01, и Столбец "СубконтоКт1"==71,01. Прописываю первое условие и все отображает ок. Добавляю второе и выводит ошибку. Подскажите,…
Vlad Vladov
  • 173
  • 8
2
votes
1 answer

pandas DataFrames aggregate min max mean

Есть DataFrame columns=['author_id', 'author_name', 'book_title', 'price'] Нужно получить DataFrame columns=['author_name', 'max_price', 'min_price'] Желательно через groupby('author_name').agg({'price': 'min', 'price': 'max'}) И тут сложности,…
Kamo Petrosyan
  • 425
  • 3
  • 16
1
vote
0 answers

Pandas. Значения NaN на разных системах

Открываю xlsx файл в котором в одной из ячеек находится формула: =ГИПЕРССЫЛКА("http://zakupki.gov.ru/epz/order/notice/ea44/view/common-info.html?regNumber=0334300062817000005";"0334300062817000005") import pandas as pd df =…
Gremlin
  • 73
1
vote
1 answer

Как выбрать определенные записи и применить к столбцу функцию?

У меня есть некий датасет, например: Marked City. Marked 1 0 New York 1 2 1 California 0 Хочу выбрать записи из фрейма данных, где Marked равен 1, и применить некоторую функцию к строке City. Фрейм данных…
1
vote
1 answer

Фильтр по датам, еще одному условию dataframe

Есть dataframe: Загружаю файл, делаю индексом одну из колонок. Колонок всего 7. Необходимо схлопнуть по "СубконтоДт1" и при этом отфильтровать по дате и поставщику. Ниже привожу пример, что должно получиться. Дата …
Vlad Vladov
  • 173
  • 8
1
vote
1 answer

Изменение части строк в pandas

У меня есть датафрейм со строчками такого вида: str_1 | str_2 | str_3 | number_1 | number_2 |... | number_n Я хочу каждое число в такое строчке поделить на сумму всех остальных чисел в этой строчке, оставив все остальные значения. Каким образом…
0
votes
1 answer

Как обойти в цикле строки pandas и выполнить действие:

Имею таблицу: с несколькими столбцами "tpm_z" и "tpm_b". Необходимо рассчитать критерий Манна-Уитни в каждой строке и внести значение в новый столбец. Как это сделать с помощью цикла, пожалуйста помогите. import scipy.stats as stats g =…
Nic
  • 5
0
votes
0 answers

Найти общие курсы, на которые записывались студенты разных годов обучения PANDAS

Есть два датасета, в котором данные о студентах "2010" и "2011" года обучения. У них есть 3 колонки, где указаны курсы по выбору. 1.Необходимо найти курсы, на которые записали студенты обоих годов обучения. 2.Также, методом исключения, найти курсы,…
Yankoi
  • 1
0
votes
2 answers

Как отсортировать те строки таблицы pandas, в которых NaN встречается ровно 2 раза?

Таблица состоит из 5 столбцов и большого количества строк, в каждой строке содержится от 1 до 4 NaN, необходимо оставить те строки, в которых NaN встречается ровно 2 раза
Nic
  • 5
0
votes
0 answers

list comprehension c несколькими списками и условиями

Есть дата фрейм df = pd.DataFrame({'Val': [10, 150, 9, 13], 'R1':[101,102,103,104]}) требуется создать новую колонку 'Rnew' на основе имеющихся данных. условия для заполнения колонки: if Val >100 then Rnew = f(R1) …
0
votes
0 answers

Pandas. Как отфильтровать таблицу по условию, пока ей не присвоена переменная

Подсмотрел где-то такой стиль написания кода как "Chaining" (когда не присваиваешь каждому шагу новую переменную, а пишешь как-будто сплошным рецептом). Так вот столкнулся с проблемой. Сразу оговорюсь, понятно, что можно решить много какими другими…
0
votes
0 answers

обновление версии Pandas для чтения Excel

Колаб вдруг перестал читать Excel - файлы. С 01.02.2022. Раньше все было ок. Пишет: ImportError: Pandas requires version '3.0.0' or newer of 'openpyxl' (version '2.5.9' currently installed). Что делать? такое pip install pandas - не помогает...
MarinaS
  • 55
  • 3
0
votes
0 answers

Не могу заполнить NaN значения Pandas

Я использую Pandas для предобработки данных. Пропущенные значения хочу заполнить модой по каждому столбцу. Но при выполнении кода все равно остается 21 пропущенное значение... Соответственно при обучении модели выдает ошибку ValueError: Input…
0
votes
0 answers

запись данных в 1 столбец из 1 переменной pandas python

Пишу парсер, у меня в цикле идет парсинг города с разных страниц, и все лежит в одной переменной, если я в цикле пишу код на запись данных этой переменной в xlsx, то каждый раз файл перезаписывается, а мне надо, чтобы он записывал каждое значение в…
0
votes
0 answers

Цикл по колонкам датафрейма

Есть датафрейм, хочу посчитать интеграл от каждого столбца, пятаюсь сделать в цикле, никак не получается. import numpy as np from scipy.integrate import simps from numpy import trapz LT = [] x = np.arange(len(p)) for column in p.columns: …
1
2