pandas- все статьи тега


Фрейм данных Pandas, имеющий дополнительный " слой"

Предположим, что у вас есть следующий фрейм данных: import pandas as pd import numpy as np df = pd.DataFrame(np.nan,columns=['A','B','C'],index=[0,1,2]) Предположим, мне нужен дополнительный "слой" поверх этого фрейма данных pandas, такой, что столбец A, строка 0 будет иметь свое значение, столбец B, строка 0 будет иметь другое значение, столбец C, строка 0 будет иметь что-то, столбец A, строка 1 и так далее. Таким образом, как фрейм данных поверх этого существующего. Можно ли добавить дру ...

Вычислить средневзвешенное значение с помощью фрейма данных pandas

У меня есть следующий фрейм данных pandas: data_df = pd.DataFrame({'ind':['la','p','la','la','p','g','g','la'], 'dist':[10.,5.,7.,8.,7.,2.,5.,3.], 'diff':[0.54,3.2,8.6,7.2,2.1,1.,3.5,4.5], 'cas':[1.,2.,3.,4.,5.,6.,7.,8.]}) То есть cas diff dist ind 0 1 0.54 10 la 1 2 3.20 5 p 2 3 8.60 7 la 3 4 7.20 8 la 4 5 2.10 7 p 5 6 1.00 2 g 6 7 3.50 5 g 7 ...

Как удалить строки из фрейма данных pandas, содержащего определенную строку в определенном столбце?

У меня есть очень большой фрейм данных в python, и я хочу удалить все строки, которые имеют определенную строку внутри определенного столбца. Например, я хочу удалить все строки, которые имеют строку " XYZ " в качестве подстроки в столбце C фрейма данных. Может ли это быть реализовано эффективным способом с помощью .метод drop ()? ...

Как извлечь ячейку из фрейма данных панды

Скажем, я создаю pandas фрейм данных (я не очень хорош в pandas, и это может быть не очень эффективно): import pandas as pd colnames = ['a', 'b'] data = pd.DataFrame(columns=colnames) df_row = ['val1', 'val2'] app = pd.Series(df_row, index=cols) data = data.append(app, ignore_index=True) Я хочу получить доступ к val1 как к строке, а не как к объекту pandas. Если я это сделаю: cell = data.iloc[[0],[0]] type(cell) Я вижу, что cell имеет тип <class 'pandas.core.frame.DataFrame'> Ес ...

Подключайтесь к Hive и создавайте таблицы с помощью pandas

У меня есть фрейм данных pandas в PYTHON. Я хочу создать / загрузить этот фрейм данных в таблицу hive. Я знаю, что мы можем создать фрейм данных spark из фрейма данных pandas и создать таблицу hive. Я хотел бы сделать это, используя чистый python способ, не используя pyspark. Я установил pyhive pyhs2 в моем местном python Используя pyhive conn_1 = hive.Connection(host=hive_host, port=10000, username=username) Я получаю следующую ошибку: NotImplementedError: Wrong number of arguments f ...

Pandas Multiindex from array => TypeError: unhashable тип: 'dict'

Я пытаюсь создать фрейм данных из массива со следующей структурой: df = [[{'date_time': Timestamp('2015-05-22 05:37:59'), 'name': 'Tom', 'value': '129'}, {'date_time': Timestamp('2015-05-22 05:37:59'), 'name': 'Kate', 'value': '0'}, {'date_time': Timestamp('2015-05-22 05:37:59'), 'name': 'GroupeId', 'value': '0'}, {...}, {...}, {...}],[another list of dictionaries like the first one],[and another one]] Используя этот код: def cr ...