r- все статьи тега


R - язык для статистической обработки данных. Часть 1/3

Я сам изучал R в течение последних нескольких недель.  В своей статье я рассказываю о языке программирования R и его главных концепциях, которые пригодятся каждому исследователю данных. Мотивация Сфера науки о данных и развивающихся вычислений требуют от нас всё время адаптироваться и вырабатывать новые навыки. Причина в том, что эта область ...

R - язык для статистической обработки данных. Часть 2/3

(adsbygoogle = window.adsbygoogle || []).push({ google_ad_client: "ca-pub-1591034030238691", enable_page_level_ads: true }); (adsbygoogle = window.adsbygoogle || []).push({ google_ad_client: "ca-pub-1591034030238691", enable_page_level_ads: true }); Приверженцы парного прог...

R - язык для статистической обработки данных. Часть 3/3

Часть 1, Часть 2, Часть 3 В предыдущем материале мы остановились на теме корреляции из раздела “Статистические вычисления в языке R”. Переходим к ковариации.  Ковариация Ковариация была придумана для того, чтобы у нас была информация об отношениях между переменными.  covariance <- cov(A, B) print(covariance) Стандартизация и нормализа...

Введение в R: линейная алгебра

R — очень мощный язык, разработанный специально для анализа и визуализации данных и машинного обучения, что делает его обязательным к изучению для любого начинающего специалиста по данным.  R особенно удобен для линейной алгебры. Встроенные типы данных, такие как векторы и матрицы, хорошо сочетаются со встроенными функциями, такими как алгори...

Установите параметры графики R локально, но не глобально?

Есть ли способ установить или замаскировать par() в локальной среде? Я не очень хорошо знаком с R-окружениями, поэтому мне не ясно, почему это невозможно, хотя я определенно понимаю, почему это не поведение по умолчанию. Я видел этот вопрос, но я не знаю достаточно, чтобы знать, применим ли он здесь. Я также был бы удивлен, если бы не было способа настроить путь поиска, чтобы заставить его работать. Опять же, нет никакого способа настроить алгоритм, который решает, следует ли опустите некоторы ...

Скользящее среднее по данным группы R.стол

Я хочу вычислить скользящее среднее значение YTD по группе, начиная с первой строки в группе и заканчивая последней строкой. Пример ниже... Group <- c(rep("a",5), rep("b",5)) Sales <- c(2,4,3,3,5,9,7,8,10,11) Result <- c(2,3,3,3,3.4,9,8,8,8.5,9) df <- data.frame(Group, Sales, Result) Столбец результатов-это то, что я ожидаю увидеть из скользящего среднего. ...

Есть ли способ показать перекрывающиеся гистограммы в R без регулировки прозрачности?

Цель состоит в том, чтобы показать перекрывающиеся гистограммы, но я хочу избежать использования Альфа-коррекции, чтобы цвета оставались яркими. Есть ли способ сделать это без корректировки Альфа-арг? Цель состоит в том, чтобы отобразить цвета, показанные ниже: hist(rnorm(mean=10, n = 1000), col='blue') hist(rnorm(mean=11, n = 1000), col='red', add=T) Но также покажите область перекрытия, как показано здесь hist(rnorm(mean=10, n = 1000), col='blue') hist(rnorm(mean=11, n = 1000), co ...

презентация rmarkdown beamer: как не печатать слайды разделов?

Я пишу презентацию beamer в rmarkdown и конвертирую ее в pdf с помощью knitr. Я хочу определить разделы на уровне header1, например # Introduction, а затем иметь слайд под названием Что-то другое, например ## Introducing my brilliant research. Наличие уровня header1, определяющего разделы, приятно, поскольку имена разделов могут отображаться в заголовке слайда в определенных темах beamer, и именно поэтому я включаю его. Но я не хочу, чтобы rmarkdown вставлял слайд, который просто говорит назва ...

Изображения оттолкнулись от слайдов в выводе бимера из R markdown

Я использую R markdown v2 для создания презентации beamer. Большинство моих слайдов содержат изображение, сгенерированное ggplot, иногда с пояснительным текстом над этим слайдом. Я обнаружил, что мне действительно нужно индивидуально настроить размер каждого элемента (например, изображения, текста и т. д.) На каждом слайде, чтобы гарантировать, что изображение не будет отталкиваться от конца слайда. Это в конечном итоге становится очень трудоемким, и своего рода поражает одну из заявленных це ...

Как раскрасить метки дендрограммы в соответствии с определенными группами? (в R)

У меня есть числовая матрица в R с 24 строками и 10 000 столбцами. Имена строк этой матрицы в основном являются именами файлов, из которых я прочитал данные, соответствующие каждой из 24 строк. Кроме того, у меня есть отдельный список факторов с 24 целыми, указывающий группу, к которой принадлежат 24 файла. Существует 3 группы-спирты, углеводороды и сложные эфиры. Имена и соответствующая группа, к которой они принадлежат, выглядят следующим образом: > MS.mz [1] "int-354.19" "int-361.35" "in ...

C5. 0 дерево решений-код c50 вызывается exit со значением 1

Я получаю следующую ошибку код c50 называется exit with value 1 Я делаю это на титанических данных, доступных из Kaggle # Importing datasets train <- read.csv("train.csv", sep=",") # this is the structure str(train) Вывод : - 'data.frame': 891 obs. of 12 variables: $ PassengerId: int 1 2 3 4 5 6 7 8 9 10 ... $ Survived : int 0 1 1 1 0 0 0 0 1 1 ... $ Pclass : int 3 1 3 1 3 3 1 3 3 2 ... $ Name : Factor w/ 891 levels "Abbing, Mr. Anthony",..: 109 191 358 2 ...

Как поместить заголовок main в горизонтальный центр всего окна графика? [дубликат]

На этот вопрос уже есть ответ здесь: Как выровнять заголовок ggplot с окном, а не с сеткой графика? 2 ответа Я делаю горизонтальные линейчатые графики с помощью ggplot2. Я хотел бы поместить основное название участка над фактической областью построения, как обычно, но расположить его горизонтально по всей ширине окна участка. Основной заголовок по умолчанию центрируется по горизонтали на ширину фактичес ...

Проблемы при использовании ggplot AES string, group и linetype

Допустим, у меня есть такой набор данных: x <- rnorm(1000) y <- rnorm(1000, 2, 5) line.color <- sample(rep(1:4, 250)) line.type <- as.factor(sample(rep(1:5, 200))) data <- data.frame(x, y, line.color, line.type) Я пытаюсь построить группу переменных x и y взаимодействием линий.тип и линия.цвет. Кроме того, я хочу указать тип линии с помощью line.введите и цвет с помощью линии.цвет. Если я напишу это: ggplot(data, aes(x = x, y = y, group = interaction(line.type, line.color), ...

Использование lapply.SD в данных.таблица R

Мне не очень ясно, как использовать .SD и by. Например, означает ли приведенный ниже фрагмент: "измените все столбцы в DT на фактор, кроме A и B?- В руководстве data.table также говорится: ".SD относится к подмножеству data.table для каждой группы (исключая столбцы группировки) " - так столбцы A и B исключены? DT = DT[ ,lapply(.SD, as.factor), by=.(A,B)] Однако я также читал, что by означает "группировать по" в SQL, когда вы делаете агрегацию. Например, если я хотел бы суммировать (наприм ...

нечисловой аргумент для ошибки двоичного оператора только в пределах apply

У меня есть ошибка" нечисловой аргумент к двоичному оператору". Я знаю, что оба аргумента числовые. Как ни странно, вычисление работает, если я просто выполняю эту строку в одиночку, но когда я пытаюсь обернуть ее в 'apply', это дает мне ошибку "нечисловой аргумент для двоичного оператора". Вот Ошибка: Error in IPmz * mz_winppm : non-numeric argument to binary operator Они числовые: > mode(IPmz) [1] "numeric" > mode(mz_winppm) [1] "numeric" Вот мой код: FindNovelIPFeats<-func ...

ggmap's get map возвращает ' ошибка в gzfile (файл, "rb"): не удается открыть соединение'

У меня есть некоторый R-код для построения данных на картах с помощью ggmap. На прошлой неделе он работал нормально. Однако теперь, когда я запускаю линию, чтобы получить карту: emap <- get_map(c(-2.503704,43.18735),zoom=9,maptype="roadmap",color="bw") Я получаю следующую ошибку: Error in gzfile(file, "rb") : cannot open the connection In addition: Warning message: In gzfile(file, "rb") : cannot open compressed file '/var/folders/2w/2wSOAL2LFUC+2QkRaR1wI++++TI/-Tmp-//Rtmpj0TMx5/ggma ...

R-ggplot2: область geom теряет свою заполняемость, если заданы ограничения на максимальное и минимальное значения из данных.рамка

Я пытаюсь воспроизвести sparkline с ggplot2, как тот, что внизу этого изображения: Используя следующий код, я получаю результат, отображаемый в конце кода. Примечание: мои фактические данные.рамка имеет только 2 ряда. Поэтому результат выглядит как одна строка. # Create sparkline for MM monthly # sparkline(dailyMM2.aggregate.monthly$Count, type = 'line') p <- ggplot(dailyMM2.aggregate.monthly, aes(x=seq(1:nrow(dailyMM2.aggregate.monthly)), y=Count)) + geom_area(fill="#83CAF5") + ge ...

Использование ковариационной матрицы для оптимизации портфеля в R

У меня есть вопрос относительно оптимизации портфеля в R. Я очень новичок в R и пытался изучить и посмотреть ответы, но я не уверен, что это правильно. Надеюсь, кто-нибудь сможет мне помочь. Я получил ковариационную матрицу из модели активов с использованием эконометрической модели (здесь я использую DCC GARCH для моделирования моей доходности активов). После того, как я сделаю прогноз, я получу матрицу ковариации. Итак, теперь, как я могу использовать эту ковариационную матрицу для оптимизации ...

Конкатенация строк с использованием функции apply в R

У меня есть следующий код, цель которого-расшифровать последовательность в кортежах из трех человек. Он выполняется правильно, но особенно медленно, когда применяется к очень большим наборам данных (т. е. миллионам строк). Я подозреваю, что виновник - это "for - loops" через вектор (в частности, для y: цикла), и чувствую, что должен быть более эффективный метод, использующий одну из функций apply-к сожалению, я не слишком знаком с этим подходом и хотел бы запросить некоторые из них. помощь (пож ...

Как удалить фасеты из ggplot2 facet wrap?

Я пытаюсь использовать пакет cregg через примеры здесь. Учебник работает хорошо. Однако после создания графика с фасетированием должен быть самый правый столбец с меткой NA. Я пробовал несколько способов, но все еще не могу удалить его. Кто-нибудь может помочь? Спасибо! Коды следующие: library("cregg") data("immigration") stacked <- cj(immigration, ChosenImmigrant ~ Gender + Education + LanguageSkills + CountryOfOrigin + Job + JobExperience + JobPlans + ReasonForApplic ...