pandas- все статьи тега ➜ страница 5


Как преобразовать индекс pandas в фрейме данных в столбец?

это кажется довольно очевидным, но я не могу понять, как преобразовать индекс фрейма данных в столбец? например: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 в, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596 ...

Каков наиболее эффективный способ перебора кадров данных с пандами?

Я хочу выполнять свои собственные сложные операции с финансовыми данными в кадрах данных в последовательном порядке. например, я использую следующий файл MSFT CSV, взятый из Yahoo Finance: Date,Open,High,Low,Close,Volume,Adj Close 2011-10-19,27.37,27.47,27.01,27.13,42880000,27.13 2011-10-18,26.94,27.40,26.80,27.31,52487900,27.31 2011-10-17,27.11,27.42,26.85,26.98,39433400,26.98 2011-10-14,27.31,27.50,27.02,27.27,50947700,27.27 .... затем я делаю следующее: #!/usr/bin/env python from pandas ...

Установите значение для конкретной ячейки в фрейме данных pandas с помощью индекса

Я создал панд DataFrame df=DataFrame(index=['A','B','C'], columns=['x','y']) и x y A NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки " C "и столбца "x". Я ожидал получить такой результат: x y A NaN NaN B NaN NaN C 10 NaN этот код: df.xs('C')['x']=10 но содержание df не изменились. Это снова только Нэн в кадре данных. какие предложения? ...

Создание пустого фрейма данных Pandas, а затем его заполнение?

Я начинаю с документов фрейма данных pandas здесь:http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнить фрейм данных значениями в виде временного ряда расчета. Поэтому в основном я хотел бы инициализировать фрейм данных со столбцами A, B и строками временных меток, все 0 или все NaN. затем я добавлю начальные значения и перейду к этим данным, вычисляя новую строку из предыдущей строки, скажем row[A][t] = row[A][t-1]+1 или так. в настоящее время я использую к ...

Как подсчитать количество строк в группе (и другие статистические данные) в pandas group by?

у меня есть фрейм данных df и я использую несколько столбцов из его groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() таким образом, я почти получаю таблицу (фрейм данных), что мне нужно. Отсутствует дополнительный столбец, содержащий количество строк в каждой группе. Другими словами, Я имею в виду, но я также хотел бы знать, сколько число было использовано для получения этих средств. Например, в первой группе есть 8 значений, а во второй 10 и так далее. ...

панды: фильтровать строки фрейма данных с цепочкой операторов

большинство операций в pandas можно выполнить с цепочкой оператора (groupby,aggregate,apply и т. д.), Но единственный способ, который я нашел для фильтрации строк, - это обычное индексирование скобок df_filtered = df[df['column'] == value] это непривлекательно, как это требует я назначаю df к переменной, прежде чем иметь возможность фильтровать по ее значениям. Есть что-то более похожее на следующее? df_filtered = df.mask(lambda x: x['column'] == value) ...

Как сбросить индекс в фрейме данных pandas?

у меня есть фрейм данных, из которого я удаляю некоторые строки. В результате я получаю фрейм данных, в котором индекс выглядит примерно так:[1,5,6,10,11] и я хотел бы сбросить его в [0,1,2,3,4]. Как я могу это сделать? добавил следующий, кажется, работает: df = df.reset_index() del df['index'] следующее не работает: df = df.reindex() ...

Импорт нескольких файлов csv в pandas и объединение в один фрейм данных

Я хотел бы прочитать несколько csv-файлов из каталога в pandas и объединить их в один большой фрейм данных. Я не смог это выяснить. Вот что у меня есть до сих пор: import glob import pandas as pd # get data file names path =r'C:DRODCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate all data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True) Я думаю, мне нужна помощь в цикле for??? ...

Как создать тестовые и обучающие образцы из одного фрейма данных с панд?

У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования. спасибо! ...

UnicodeDecodeError при чтении CSV-файла в панд с Python

Я запускаю программу, которая обрабатывает 30 000 подобных файлов. Случайное число из них останавливаются и производят эту ошибку... File "C:Importersrcdfmanimporter.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:Python33libsite-packagespandasioparsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:Python33libsite-packagespandasioparsers.py", line 205, in _read return parser.read() File "C:Pyt ...

Python Pandas ошибка токенизации данных

Я пытаюсь использовать панды для манипулирования .CSV-файл, но я получаю эту ошибку: панды.синтаксический анализатор.CParserError: ошибка маркирования данных. C ошибка: ожидается 2 поля в строке 3, увидел 12 Я попытался прочитать документы панды, но ничего не нашел. мой код очень простой: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Как я могу решить это? Я должен использовать csv модуль или другой язык ? файл из Морнингстар ...

Как повернуть фрейм данных

что такое pivot? как мне повернуть? этот стержень? длинный формат в широкий формат? я видел много вопросов о сводных таблицах. Даже если они не знают, что они спрашивают о сводных таблицах, они обычно это делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все аспекты поворота.... ... Но я собираюсь дать ему идти. проблема с существующими вопросами и ответами заключается в том, что часто вопрос фокусируется на нюансе, который ОП имеет проблемы с обобщен ...

Преобразование Python dict в фрейм данных

у меня есть словарь Python, как показано ниже: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06- ...

Переназначение значений в столбце pandas с помощью dict

у меня есть словарь, который выглядит так: di = {1: "A", 2: "B"} Я хотел бы применить его к столбцу "col1" фрейма данных, аналогичного: col1 col2 0 w a 1 1 2 2 2 NaN для: col1 col2 0 w a 1 A 2 2 B NaN как я могу лучше всего это сделать? По какой-то причине термины googling, относящиеся к этому, показывают мне только ссылки о том, как сделать столбцы из диктовок и наоборот :-/ ...

Название или имя столбца индекса Pandas

Как мне получить имя столбца индекса в python pandas? Вот пример фрейма данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 то, что я пытаюсь сделать, это получить / установить заголовок индекса dataframe. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' : ["Apples", "Oranges", "Puppies", "Ducks"]} df = pd.DataFrame(data) df.index = df["Index ...

подсчитайте частоту появления значения в столбце фрейма данных

у меня есть набор данных |category| cat a cat b cat a Я хотел бы иметь возможность вернуть что-то вроде (показывая уникальные значения и частоту) category | freq | cat a 2 cat b 1 ...

Pandas DataFrame-найти строку, где значения для столбца максимальны

Как я могу найти строку, для которой значение определенного столбца maximal? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующие строки. ...

Как удалить строки из фрейма данных pandas на основе условного выражения

у меня есть фрейм данных pandas, и я хочу удалить строки из него, где длина строки в определенном столбце больше 2. Я знаю, что могу использовать df.dropna() чтобы избавиться от строк, которые содержат какие-либо NaN, но я не вижу как удалить строки на основе условного выражения. ответ на этот вопрос кажется очень близко к тому, что я хочу ... кажется, я должен быть в состоянии сделать что-то вроде этого: df[(len(df['column name']) < 2)] но я просто получить ошибка: KeyError: u'no item ...

Применить функцию панды к столбцу, чтобы создать несколько новых столбцов?

как это сделать в панд: у меня есть функция extract_text_features в одном текстовом столбце, возвращая несколько выходных столбцов. В частности, функция возвращает 6 значений. функция работает, однако, похоже, что нет никакого правильного типа возврата (pandas DataFrame / numpy array / Python list), так что выход может быть правильно назначен df.ix[: ,10:16] = df.textcol.map(extract_text_features) поэтому я думаю, что мне нужно вернуться к итерации с df.iterrows(), согласно этой? обновление: ...

получить список столбцов фрейма данных pandas на основе типа данных

Если у меня есть фрейм данных со следующими столбцами: 1. NAME object 2. On_Time object 3. On_Budget object 4. %actual_hr float64 5. Baseline Start Date datetime64[ns] 6. Forecast Start Date datetime64[ns] Я хотел бы быть в состоянии сказать: вот фрейм данных, дайте мне список столбцов, которые имеют тип Object или типа ...