Кто разобрался с датами?

13.11.2018, 04:51:59
Друзья добрый день (коллегами назвать язык не поворачивается, до коллег мне ещё учиться и учиться), только скачал данные и сразу возник вопрос.
Подскажите, а кто с датами разобрался? В subs_csi только день и месяц, в subs_features почему то 2001 - 2002 года, а subs_bs_consumption снова только день и месяц. Может год вообще отбросить и работать только с месяцами? С другой стороны у нас нет гарантий, что данные идут с начала года, точнее я уверен что они идут не с начала года. Как тогда объединять данные?
Отредактировано 13.11.2018, 04:53:12
13.11.2018, 06:42:13
Меня можешь называть Коллегой :)
я тоже не очень

с датами вообще не заморачиваюсь

мб потом надо будет с ними что то делать (например брать только ближайшие значения к моменту опроса)
имхо для начала сторительства моделей даты ввобще ненужны :)
13.11.2018, 07:46:01
Игорь Чепелев
Меня можешь называть Коллегой :)
я тоже не очень

с датами вообще не заморачиваюсь

мб потом надо будет с ними что то делать (например брать только ближайшие значения к моменту опроса)
имхо для начала сторительства моделей даты ввобще ненужны :)

Добрый день, да я увидел что даты идут с 06.2001 по 05.2002 и месяца не пересекаются.
В данный момент я не могу решить другую задачу, я хотел посчитать количество потребленных услуг каждым абонентом в месяц (трафик и голос). Но я не смог преобразовать строку ',000155737994479018044122229174329417025' в float, и соответственно просуммировать данные значения.

Как вы вышли из этой ситуации? Просто откинули лишние знаки? Сразу хочу сказать что я здесь только ради опыта и на ваши деньги не претендую :)
13.11.2018, 07:52:00
GTPSE
хотел посчитать количество потребленных услуг каждым абонентом в месяц

Неплохая идея :)
я до такого недодумался

GTPSE
Как вы вышли из этой ситуации?
Просто откинули лишние знаки?

да, округлил и просуммировал по каждому
группировку по месяцам не делал - мб зря :) надо будет попробовать
13.11.2018, 07:59:22
Да и вообще подскажите как преобразовать в число значения начинающиеся с запятой (то есть когда ноль отброшен). Пробовал так:

df[A].apply(lambda x: x.replace(',', '0.', inplace=True)).astype('float64')

и так:

df[A].replace(',', '0.', inplace=True)).astype('float64')

Оба варианта не работают.
Отредактировано 13.11.2018, 07:59:50
13.11.2018, 08:13:40
GTPSE
Да и вообще подскажите как преобразовать в число значения начинающиеся с запятой (то есть когда ноль отброшен)

сначала всю колонку в характер
потом запятую заменять на точку
потом заменять на нумерик
(и согласно ограничению по точности Options - все округлиться)
13.11.2018, 08:22:40
Игорь Чепелев
GTPSE
Да и вообще подскажите как преобразовать в число значения начинающиеся с запятой (то есть когда ноль отброшен)

сначала всю колонку в характер
потом запятую заменять на точку
потом заменять на нумерик
(и согласно ограничению по точности Options - все округлиться)
характер - это что? (я на Python пишу)
13.11.2018, 08:35:51
GTPSE
характер - это что? (я на Python пишу)

строка

при загрузке значение может определиться как Фактор
поэтому на всяк лучше значала в строку перевернуть

помоему на питоне - string
13.11.2018, 08:35:51
GTPSE
характер - это что? (я на Python пишу)

строка

при загрузке значение может определиться как Фактор
поэтому на всяк лучше значала в строку перевернуть

помоему на питоне - string
13.11.2018, 14:04:12
GTPSE
Да и вообще подскажите как преобразовать в число значения начинающиеся с запятой (то есть когда ноль отброшен). Пробовал так:

df[A].apply(lambda x: x.replace(',', '0.', inplace=True)).astype('float64')

и так:

df[A].replace(',', '0.', inplace=True)).astype('float64')

Оба варианта не работают.

можно так
c_te[cc] = pd.to_numeric(c_te[cc].apply(lambda x: re.sub(',', '.', str(x))))


Зарегистрируйтесь или войдите, чтобы оставить сообщение.