neural-network- все статьи тега


Обучение несбалансированным данным с использованием TensorFlow

Ситуация: Меня интересует, как оптимально использовать TensorFlow, когда моя обучающих данных является дисбаланс в распределении метки между 2 метками. Например, предположим, что учебник MNIST упрощен, чтобы различать только 1 и 0, где все доступные нам изображения являются либо 1, либо 0. это легко обучить с помощью предоставленных учебников TensorFlow, когда у нас есть примерно 50% каждого типа изображений для обучения и тестирования. Но как насчет этого дела где 90% изображений, доступных ...

Понимание простой LSTM pytorch

import torch,ipdb import torch.autograd as autograd import torch.nn as nn import torch.nn.functional as F import torch.optim as optim from torch.autograd import Variable rnn = nn.LSTM(input_size=10, hidden_size=20, num_layers=2) input = Variable(torch.randn(5, 3, 10)) h0 = Variable(torch.randn(2, 3, 20)) c0 = Variable(torch.randn(2, 3, 20)) output, hn = rnn(input, (h0, c0)) Это пример LSTM из docs. Я не знаю, понимаю следующие вещи: Что такое выходной размер и почему он нигде не указан? По ...

Почему бинарная кроссэнтропия более точна, чем категориальная кроссэнтропия для многоклассовой классификации в Керасе?

Я учусь создания сверточных нейронных сетей с использованием выбранной позиции. Я пытаюсь получить высокую точность для набора данных MNIST. По-видимому, categorical_crossentropy относится к более чем 2 классам, а binary_crossentropy - к 2 классам. Поскольку существует 10 цифр, я должен использовать categorical_crossentropy. Однако после обучения и тестирования десятков моделей binary_crossentropy последовательно значительно превосходит categorical_crossentropy. На Kaggle я получил точность 99 ...

Тонкая настройка VGG16 Keras: низкая точность

Я уже задавал подобный вопрос здесь , но теперь у меня немного другая проблема, поэтому я задаю новый вопрос. Я решил использовать несколько иной подход вместо предложенного среди ответов в упомянутом вопросе для обучения, а затем тонкой настройки модели. Update : Я заменил старый вопрос, представленный здесь, более подходящей версией Вот моя последовательность действий: построить модель VGG16 и падение сверху слой (назовем его no-top model) создание узких мест с использованием модел ...

Что же ТФ.НН.conv2d сделать в тензорном потоке?

Я смотрел на документы tensorflow о tf.nn.conv2dздесь. Но я не могу понять, что он делает или чего он пытается достичь. Он говорит на документах, #1: сглаживает фильтр до 2-D матрицы с формой [filter_height * filter_width * in_channels, output_channels]. что это? Это поэлементное умножение или просто матричное умножение? Я также не мог понять два других пункта, упомянутых в документах. У меня есть написал их ниже : # 2: извлекает патчи изображения из входного тензора, чтобы сфо ...

Оценка числа нейронов и числа слоев искусственной нейронной сети [закрыто]

Я ищу способ, как рассчитать количество слоев и количество нейронов в слое. В качестве входных данных у меня есть только размер входного вектора, размер выходного вектора и размер набора учебные. обычно лучшая сеть определяется путем пробования различных топологий сети и выбора одной с наименьшей ошибкой. К сожалению, я не могу этого сделать. ...

Как присвоить значение переменной TensorFlow?

Я пытаюсь присвоить новое значение переменной tensorflow в python. import tensorflow as tf import numpy as np x = tf.Variable(0) init = tf.initialize_all_variables() sess = tf.InteractiveSession() sess.run(init) print(x.eval()) x.assign(1) print(x.eval()) но выход я получаю 0 0 таким образом, значение не изменилось. Чего мне не хватает? ...