Классификация пациентов. Часть 3. Подготовка данных.
Мы уже определили наш первый набор предкторов. Это 6 самый популярных измерений, которые представленны числами и имеют указанные в базе единицы измерения. Однако все они предствелнны множеством измерений во времени, своего рода временными рядами. Наше же выборка должна иметь условно вид таблицы. Рисунок временной ряд для пульса. Самое простое, что можно придумать это взять среднее значение. В SQL это возвращается функциеей AVG(). Напишем запрос возврашающий среднее значние всех измерений гемоглабина для каждого пациента. SELECT --hemoglobin ch.hadm_id , AVG(valuenum) as avg_valuenum FROM mimiciii.chartevents_sepsisv_d ch , mimiciii.admissions_sepsisv_d ad WHERE ad.hadm_id = ch.hadm_id AND (ch.itemid = 220228 -- hemoglobin_id OR ch.itemid = 814) -- hemoglobin_id GROUP BY ch.hadm_id Такй запрос возвращает 5265 строк и учитывет оба возможных кода измерения гемоглобина, в то же время он исключает повторы, та...