Добрый день всем! Может кому то покажется простым данный вопрос...но все таки прошу помощи! Дано большое количество данных в таблице Exel.
Пользователь отвечает на вопросы. Каждому пользователю присвоен уникальный ID (столбец User ID). Количество ответов на которые пользователь отвечает - произвольное (т.е. прерваться можно в любой момент). Пользователь может ответить правильно или не правильно. (столбец is right, соответственно 1 если ответ был правильный, 0 если не правильный).
Первое что интересует - зависит ли количество вопросов на которые ответил пользователь, от того насколько правильно отвечал Т.е. грубо говоря: сгруппировать, посчитать размер группы (количество строк), а также посчитать каков процент правильных ответов. Загвоздка именно в этом первом этапе, как потом статистически проанализировать взаимосвязь - понятно. А как сделать такую выборку из большой таблицы в несколько тысяч строк - не ясно.
Вторая задача чуть сложнее: необходимо выяснить какой из ответов был последним. Соответственно, этот ответ может быть правильным или не правильным. Общее количество правильных и неправильных ответов нужно сравнить.
Вообщем, буду благодарна всем ответам. И очень прошу, без издевательств, иронии и флуда!!!
Добрый день всем! Может кому то покажется простым данный вопрос...но все таки прошу помощи! Дано большое количество данных в таблице Exel.
Пользователь отвечает на вопросы. Каждому пользователю присвоен уникальный ID (столбец User ID). Количество ответов на которые пользователь отвечает - произвольное (т.е. прерваться можно в любой момент). Пользователь может ответить правильно или не правильно. (столбец is right, соответственно 1 если ответ был правильный, 0 если не правильный).
Первое что интересует - зависит ли количество вопросов на которые ответил пользователь, от того насколько правильно отвечал Т.е. грубо говоря: сгруппировать, посчитать размер группы (количество строк), а также посчитать каков процент правильных ответов. Загвоздка именно в этом первом этапе, как потом статистически проанализировать взаимосвязь - понятно. А как сделать такую выборку из большой таблицы в несколько тысяч строк - не ясно.
Вторая задача чуть сложнее: необходимо выяснить какой из ответов был последним. Соответственно, этот ответ может быть правильным или не правильным. Общее количество правильных и неправильных ответов нужно сравнить.
Вообщем, буду благодарна всем ответам. И очень прошу, без издевательств, иронии и флуда!!!Dizzz