pandas- все статьи тега


Фрейм данных Pandas, имеющий дополнительный " слой"

Предположим, что у вас есть следующий фрейм данных: import pandas as pd import numpy as np df = pd.DataFrame(np.nan,columns=['A','B','C'],index=[0,1,2]) Предположим, мне нужен дополнительный "слой" поверх этого фрейма данных pandas, такой, что столбец A, строка 0 будет иметь свое значение, столбец B, строка 0 будет иметь другое значение, столбец C, строка 0 будет иметь что-то, столбец A, строка 1 и так далее. Таким образом, как фрейм данных поверх этого существующего. Можно ли добавить дру ...

Вычислить средневзвешенное значение с помощью фрейма данных pandas

У меня есть следующий фрейм данных pandas: data_df = pd.DataFrame({'ind':['la','p','la','la','p','g','g','la'], 'dist':[10.,5.,7.,8.,7.,2.,5.,3.], 'diff':[0.54,3.2,8.6,7.2,2.1,1.,3.5,4.5], 'cas':[1.,2.,3.,4.,5.,6.,7.,8.]}) То есть cas diff dist ind 0 1 0.54 10 la 1 2 3.20 5 p 2 3 8.60 7 la 3 4 7.20 8 la 4 5 2.10 7 p 5 6 1.00 2 g 6 7 3.50 5 g 7 ...

Как удалить строки из фрейма данных pandas, содержащего определенную строку в определенном столбце?

У меня есть очень большой фрейм данных в python, и я хочу удалить все строки, которые имеют определенную строку внутри определенного столбца. Например, я хочу удалить все строки, которые имеют строку " XYZ " в качестве подстроки в столбце C фрейма данных. Может ли это быть реализовано эффективным способом с помощью .метод drop ()? ...

Как извлечь ячейку из фрейма данных панды

Скажем, я создаю pandas фрейм данных (я не очень хорош в pandas, и это может быть не очень эффективно): import pandas as pd colnames = ['a', 'b'] data = pd.DataFrame(columns=colnames) df_row = ['val1', 'val2'] app = pd.Series(df_row, index=cols) data = data.append(app, ignore_index=True) Я хочу получить доступ к val1 как к строке, а не как к объекту pandas. Если я это сделаю: cell = data.iloc[[0],[0]] type(cell) Я вижу, что cell имеет тип <class 'pandas.core.frame.DataFrame'> Ес ...

Подключайтесь к Hive и создавайте таблицы с помощью pandas

У меня есть фрейм данных pandas в PYTHON. Я хочу создать / загрузить этот фрейм данных в таблицу hive. Я знаю, что мы можем создать фрейм данных spark из фрейма данных pandas и создать таблицу hive. Я хотел бы сделать это, используя чистый python способ, не используя pyspark. Я установил pyhive pyhs2 в моем местном python Используя pyhive conn_1 = hive.Connection(host=hive_host, port=10000, username=username) Я получаю следующую ошибку: NotImplementedError: Wrong number of arguments f ...

Pandas Multiindex from array => TypeError: unhashable тип: 'dict'

Я пытаюсь создать фрейм данных из массива со следующей структурой: df = [[{'date_time': Timestamp('2015-05-22 05:37:59'), 'name': 'Tom', 'value': '129'}, {'date_time': Timestamp('2015-05-22 05:37:59'), 'name': 'Kate', 'value': '0'}, {'date_time': Timestamp('2015-05-22 05:37:59'), 'name': 'GroupeId', 'value': '0'}, {...}, {...}, {...}],[another list of dictionaries like the first one],[and another one]] Используя этот код: def cr ...

Использование логического индексирования для многозначных строк и столбцов в Pandas

Вопросы в конце, вжирным шрифтом . Но сначала давайте установим некоторые данные: import numpy as np import pandas as pd from itertools import product np.random.seed(1) team_names = ['Yankees', 'Mets', 'Dodgers'] jersey_numbers = [35, 71, 84] game_numbers = [1, 2] observer_names = ['Bill', 'John', 'Ralph'] observation_types = ['Speed', 'Strength'] row_indices = list(product(team_names, jersey_numbers, game_numbers, observer_names, observation_types)) observation_values = np.random.randn(le ...

как объединить несколько листов excel из одного файла?

У меня есть большой файл excel, который содержит много разных листов. Все листы имеют одинаковую структуру, например: Name col1 col2 col3 col4 1 1 2 4 4 3 2 1 Как я могу объединить (вертикально) все эти листы в Pandas, не называя каждый из них вручную? Если бы это были файлы, я мог бы использовать glob для получения списка файлов в каталоге. Но здесь, для листов excel, я потерялся. Существует ли способ создать переменную в результирующем фрейме данных, которая иде ...