Описание тега sframe
SFrame - это табличная структура данных, используемая для хранения миллионов строк данных, которые не обязательно помещаются в память для анализа.
1
ответ
sFrame в scipy.sparse csr_matrix
У меня есть такой кадр: x = sf.SFrame({'users': [{'123': 1.0, '122': 5}, {'134': 3.0, '123': 10}]}) Я хочу преобразовать в scipy.sparse csr_matrix, не вызывая создание графической метки, а только используя sframe и Python. Как это сделать?
26 янв '16 в 01:54
2
ответа
Преобразование сгруппированных данных путем преобразования категорий группировки в поля (используя GraphLab или DataFrame Panda)
У меня есть следующие записи, сгруппированные по столбцам user_id и action. user_id | action | count 1 | read | 15 1 | write | 5 1 | delete | 7 2 | write | 2 3 | read | 9 3 | write | 1 3 | delete | 2 Я хочу преобразовать эту таблицу в следующий форм…
08 янв '17 в 15:22
6
ответов
Эффективный способ получить уникальные значения из 2 или более столбцов в Dataframe
Учитывая матрицу из SFrame: >>> from sframe import SFrame >>> sf =SFrame({'x':[1,1,2,5,7], 'y':[2,4,6,8,2], 'z':[2,5,8,6,2]}) >>> sf Columns: x int y int z int Rows: 5 Data: +---+---+---+ | x | y | z | +---+---+---+ | 1 | …
03 авг '16 в 03:07
0
ответов
Выбор строки из DataFrame в лямбда-функции
Я работаю над курсом Coursera "Машинное обучение: классификация". Задание в основном использует Sframe, но я пытаюсь использовать Pandas для решения задания. Вот проблема, с которой я столкнулся из-за разницы между SFrame и Pandas. Я могу решить про…
06 июн '18 в 07:05
6
ответов
Python: количество вхождений в dict из другого списка
Я пытаюсь подсчитать, сколько раз слово существует в столбце dict, основываясь на подмножестве заинтересованных слов. Сначала я импортирую свои данные products = graphlab.SFrame('amazon_baby.gl/') products['word_count'] = graphlab.text_analytics.cou…
04 июн '16 в 12:57
1
ответ
Ошибка в graphlab.SFrame('home_data.gl/')
Я делаю курс машинного обучения от Coursera Университета Вашингтона. В котором я использую Graphlab iPython. Во время практики, когда я выполняю нижеприведенную команду: sales = graphlab.SFrame('home_data.gl/') Я получаю ошибку: InvalidProductKey Tr…
23 авг '16 в 04:50
1
ответ
Невозможно изменить значения None в SFrame с помощью apply()
Я использую этот код для изменения None значения в SFrame: sarr['value'] = sarr['value'].apply(lambda x: '-1' if x is None else x) После запуска этого кода я все еще вижу то же самое None значения, без эффекта. Есть идеи, что здесь происходит?
26 янв '17 в 23:39
2
ответа
Преобразовать графическую структуру в словарь из {key: values}
Учитывая SFrame как таковой: +------+-----------+-----------+-----------+-----------+-----------+-----------+ | X1 | X2 | X3 | X4 | X5 | X6 | X7 | +------+-----------+-----------+-----------+-----------+-----------+-----------+ | the | -0.060292 | 0…
10 янв '16 в 21:15
0
ответов
Почему функция очистки текста не работает без декодирования в UTF8?
Я написал следующую функцию в Python 2.7 для очистки текста, но она не работает без декодирования переменной твита в utf8 # -*- coding: utf-8 -*- import re def clean_tweet(tweet): tweet = re.sub(u"[^\u0622-\u064A]", ' ', tweet, flags=re.U) return tw…
05 янв '17 в 08:03
0
ответов
Graphlab и SFrame
Я прохожу курс по машинному обучению, в котором GraphLab и SFrame используются для манипулирования данными и их загрузки. Когда я пытаюсь загрузить данные с помощью SFrame, я получаю эту ошибку: AttributeError Traceback (последний вызов был последни…
08 ноя '18 в 16:36
0
ответов
Можно ли создать объект SFrame внутри процесса, используя многопроцессорный модуль в Python?
def query(vector,model,k,radius): ##Create a sframe nearest_neighbors = graphlab.SFrame({'id':[1,2,3]}) ##Fill the sframe ##code## return nearest_neighbors def scalar_wrapper(mat): my_dataframe=pd.DataFrame(columns=ds_original.columns) ll=range(mat…
02 сен '17 в 13:24
2
ответа
Как установить значения nan/inf в Dato SFrames
Я пытаюсь установить в столбце большого фрейма данных пару значений nan/inf в одном из столбцов. Я пробовал, например, что-то вроде этого. df = df[df['a'] == 'NaN'] Или же df = df[df['a'] == 'Inf'] Как я могу ссылаться на эти типы значений в столбце?
04 июл '16 в 00:40
2
ответа
Как я могу использовать `apply` с функцией, которая принимает несколько входов
У меня есть функция, которая имеет несколько входов, и хотел бы использовать SFrame.apply создать новый столбец. Я не могу найти способ передать два аргумента в SFrame.apply, В идеале, это будет принимать запись в столбце в качестве первого аргумент…
09 окт '15 в 01:16
1
ответ
IOError при загрузке данных
Есть ли какие-либо ограничения размера данных в графической метке? У меня возникает ошибка ввода-вывода при попытке связать файл. products = graphlab.SFrame('C:\Machine Learning\Week3\amazon_baby.gl/')
05 апр '17 в 20:52
1
ответ
Graphlab - OverflowError: слишком длинный для преобразования
Я создаю разные модели полиномиальной регрессии, передавая разные способности одной и той же обучающей функции. Так что, если я хочу полиномиальную модель степени 3 функции "х". Затем к регрессионной модели я передаю x^1,x^2 и x^3 в качестве признак…
23 апр '16 в 12:56
1
ответ
Опишите и информация для SFrame
Было бы неплохо увидеть краткую информацию о SFrame, что-то похожее на то, что дает вам DataFrame от pandas с методами .info() а также .describe() Какой самый простой способ сделать это, кроме sf.to_dataframe().info(), sf.to_dataframe().describe()? …
25 июл '16 в 19:05
1
ответ
Преобразование уникальных столбцов в заголовки SFrame с соответствующими значениями
У меня есть файл с разделителями табуляции: $ echo -e 'abc\txyz\t0.9\nefg\txyz\t0.3\nlmn\topq\t0.23\nabc\tjkl\t0.5\n' > test.txt $ cat test.txt abc xyz 0.9 efg xyz 0.3 lmn opq 0.23 abc jkl 0.5 $ python >>> from sframe import SFrame >&…
21 ноя '16 в 09:22
1
ответ
Выберите конкретную строку в SFrame
Я был озадачен тем, как выбрать конкретную строку в массиве SFrame. Я могу выбрать первую строку здесь: sf +-------------------------------+ | X1 | +-------------------------------+ | [0.0, 0.0, 0.0, 0.0, 0.0, ... | [100 rows x 1 columns] sf[:1] +--…
27 июн '16 в 00:50
1
ответ
Ошибка Sframe iPython
Я посещаю курс ML на Coursera, и у меня возникают проблемы с открытием файла с SFrame, когда я пытаюсь, эта ошибка появляется: sf = graphlab.Sframe.read_csv('people.csv') ******AttributeError Traceback (most recent call last) <ipython-input-29-42…
18 ноя '16 в 13:40
2
ответа
Нарисуйте блокпост с использованием кадра в качестве источника данных
Я практикую свои навыки классификации ML в наборе данных Базы данных характеристик миллиардеров. я использую sframe для загрузки и манипулирования данными и seaborn для визуализации. В процессе анализа данных я хотел нарисовать рамку, сгруппированну…
19 мар '16 в 19:11