Geek Girl

Geek Girl "괴짜지만 예쁜 걸"

2024년 넥플리스 오리지널, 영국, 캐나다 합작 드라마, 10부작

Emily Carey가 주인공인 한 소녀의 성장 드라마다. 이 드라마에 나오는 패션 디자이너 이름이 Yuji Lee다. 이 드라마 작가가 아마도 김건희 논문에서 영감을 얻지 않았나 싶다. ㅋㅋ

Rubin’s Rule

Rubin's rule은 여러 개의 대체적(imputed) 데이터셋에서 추정된 계수를 결합하는 방법입니다.

PISA 데이터에서는 응답자의 능력치를 직접 관측할 수 없기 때문에, 능력모수의 사후분포를 이용해 무작위로 생성된 여러 개의 plausible value(PV1READ, PV2READ 등)를 제공합니다. 각 유의측정값을 개별 데이터셋으로 간주하고 분석한 후, 그 결과를 하나로 결합해야 합니다.

Rubin's rule은 이렇게 여러 대체 데이터셋에서 얻은 계수를 결합하는 규칙입니다. 구체적인 계산법은 다음과 같습니다.

  • 최종 계수 추정치 = 각 데이터셋 계수의 평균
  • 합성 표준오차 = sqrt((각 데이터셋 표준오차의 평균)^2 + (1+1/m)*B)
    여기서 m은 데이터셋 수, B는 각 데이터셋 계수의 분산

이렇게 하면 여러 측정유의값을 고려하여 최종 계수와 정확한 표준오차를 구할 수 있습니다.

라디오 체조

라디오 체조 오쿠다 히데오(2023). 라디오 체조(이영미 역). 서울: 은행나무.

공중그네의 이라부가 돌아왔다.
여전히 순수한, 제멋대로이지만 정신과 마왕인 의사.
5편의 각기 다른 주인공의 이야기이지만, 이라부가 늘 등장해서 해결해 주는 글의 형식 역시 좋았다.
피아노 레슨은 나와 비슷한 증상을 보이는 주인공의 얘기여서 특히 공감이 가는 얘기였다.

행복은 누구나 가질 수 있다

행복은 누구나 가질 수 있다
마스다 미리(2023). 행복은 누구나 가질 수 있다(박정임 역). 파주: 새의 노래.

사랑.
어른의 사랑도 우왕좌왕합니다. 풍요롭고 때로는 아픕니다. 하지만 다른 그 무엇과도 대체할 수 없는 신기한 현상이에요.어른의 사랑도 우왕좌왕합니다. 풍요롭고 때로는 아픕니다. 하지만 다른 그 무엇과도 대체할 수 없는 신기한 현상이에요.
에필로그 중에서

미우라 씨의 친구

미우라 씨의 친구
마스다 미리(2023). 미우라 씨의 친구(박정임 역). 파주: (주)이봄

인공지능 시대에 걸맞게 현대적 감각으로 새롭게 펼쳐지는 마스다 미리의 작품이다. 현대적 감각이긴 하지만 여전히 내용에 공감하게끔 하는 능력은 탁월하다. 이 책을 읽으며 친구에 대한 내 생각과 매우 비슷하다는 것을 느끼며, 또한 오랜 옛 친구들이 생각나는 그런 소설이다. 적극 추천.

테일러의 과학적 관리법

상상해 봐! 너희 반 친구들이 운동회에서 30미터 달리기를 하는데, 누가 가장 빠른지 알고 싶어. 그래서 너는 각 친구들이 달리는 모습을 꼼꼼히 관찰하고, 어떤 자세와 방법으로 뛰는 게 가장 빠른지 연구해. 그리고 그 결과를 바탕으로 "가장 빠르게 달리는 방법"이라는 설명서를 만들어 줘.

테일러의 과학적 관리법은 이와 비슷한 방법으로 "일을 가장 효율적으로 하는 방법"을 찾는 과학적인 방법이야. 옛날에는 숙련된 장인들이 자신의 경험에 의지해서 일을 했지만, 테일러는 과학적인 연구를 통해 더 나은 방법을 찾아낼 수 있다고 생각했지.

테일러는 다음과 같은 방법으로 과학적 관리법을 실천했어.

  1. 모든 일을 꼼꼼히 관찰하고 분석한다. 마치 운동선수의 달리는 모습을 분석하듯, 테일러는 노동자들이 일하는 모습을 꼼꼼히 관찰하고, 어떤 부분에서 시간이 가장 많이 소요되는지, 어떤 동작이 불필요한지 등을 분석했지.
  2. 가장 효율적인 방법을 찾아낸다. 분석 결과를 바탕으로 테일러는 불필요한 동작을 없애고, 더 빠르고 정확하게 일할 수 있는 방법을 연구했어. 마치 운동선수의 달리는 자세를 개선하듯, 테일러는 일하는 방법을 개선하여 더 효율적으로 일할 수 있도록 도왔지.
  3. 모든 사람이 같은 방법으로 일하도록 한다. 테일러는 자신이 연구해낸 "가장 효율적인 방법"을 설명서로 만들어 모든 노동자들이 같은 방법으로 일하도록 했어. 마치 운동선수들이 모두 같은 달리기 기술을 배우도록 하는 것과 비슷하지.

테일러의 과학적 관리법은 다음과 같은 장점을 가지고 있어.

  • 일을 더 빠르고 정확하게 할 수 있다. 불필요한 동작을 없애고 효율적인 방법을 사용하면 더 빠르고 정확하게 일을 할 수 있지. 마치 운동선수가 달리는 기술을 개선하면 더 빠르게 달릴 수 있는 것과 같아.
  • 생산성을 높일 수 있다. 더 많은 일을 할 수 있게 되면 회사의 생산성이 높아져 더 많은 이익을 얻을 수 있지. 마치 운동선수가 더 빠르게 달리면 경기에서 승리하여 팀에 영광을 가져다주는 것과 같아.
  • 노동자들의 임금을 높일 수 있다. 생산성이 높아지면 회사는 노동자들에게 더 많은 임금을 줄 여력이 생겨. 마치 운동선수가 좋은 성적을 거두면 더 많은 돈을 벌 수 있는 것과 같아.

하지만 과학적 관리법은 다음과 같은 단점도 가지고 있어.

  • 노동자들이 일에 대한 흥미를 잃을 수 있다. 항상 같은 방법으로 일해야 하기 때문에 노동자들이 일에 대한 흥미를 잃고, 단순 노동에 지쳐버릴 수 있어. 마치 운동선수가 항상 같은 방법으로 훈련해야 하면 지루해지고 운동을 그만두게 될 수 있는 것과 같아.
  • 노동자들과 경영진 사이에 갈등이 생길 수 있다. 테일러는 노동자들을 기계처럼 생각하고, 일에 대한 모든 권한을 경영진이 가지는 것이 좋다고 생각했어. 하지만 노동자들은 자신들의 의견을 반영할 수 없다는 불만을 가지고, 경영진과 갈등이 생길 수 있었지.

테일러의 과학적 관리법은 현대 경영학에 큰 영향을 미쳤지만, 오늘날에는 단점을 보완하기 위해 다양한 방법들이 사용되고 있어.

가중치

모집단에서 성별 비율이 남자 6 : 여자 4인 경우를 예로 들어 설명해볼게요. 여기서 모집단이란, 우리가 관심을 가지고 연구하거나 조사하고자 하는 그룹 전체를 말해요. 이 경우는 남자와 여자로 구성된 그룹이에요.

상상해 보세요, 우리가 이 모집단에서 몇 명을 무작위로 선택해서 조사를 한다고 할게요. 우리의 목표는 이 작은 그룹(샘플)을 통해 전체 모집단에 대한 정보를 얻는 거예요. 그런데 매우 중요한 포인트가 있어요. 우리가 선택한 이 작은 그룹이 모집단의 성별 비율을 잘 반영해야 한다는 거예요. 즉, 조사 대상인 샘플 그룹에도 남자가 60%, 여자가 40%가 되어야 한다는 것이죠.

예를 들어, 우리가 조사할 샘플 그룹으로 100명을 선택한다면, 남자는 60명(100명의 60%), 여자는 40명(100명의 40%)이 선택되어야 모집단의 성별 비율이 정확하게 반영된 것으로 볼 수 있어요.

하지만 현실에서는 항상 완벽한 비율로 샘플을 뽑기가 어려울 수 있어요. 그래서 여기서 '가중치'가 등장하는 거예요. 만약 우연히 여자가 더 많이 선택되어서 남자 50명, 여자 50명이 된다면, 우리는 여자에게 더 낮은 가중치를, 남자에게는 더 높은 가중치를 줘서 모집단에서의 실제 비율을 반영하도록 조정할 수 있어요.

예를 들어 남자의 가중치를 1.2 (60명이 되어야 하는데 50명이라면, 50 X 1.2 = 60), 여자의 가중치를 0.8 (40명이 되어야 하는데 50명이라면, 50 X 0.8 = 40)으로 설정할 수 있어요. 이렇게 가중치를 조정함으로써, 우리의 조사 결과가 전체 모집단을 더 잘 대표하도록 할 수 있는 거예요.

이처럼 가중치를 사용함으로써 조사나 연구 결과가 진짜 모집단을 정확하게 반영하도록 하는 게 매우 중요해요. 이를 통해 우리가 얻는 정보가 더 유용하고 신뢰할 수 있게 돼요!

규모비례확률표집 적용과 기본 확률 가중치 계산 단계

기본 개념

  • 1단계: PPS 표집 -> 군집이 클수록 표집될 확률이 더 큼
  • 2단계: 군집마다 정확하게 동일한 수의 개인이 표집됨 -> 대규모 군집에서의 개인은 표집될 확률이 더 낮음
  • 전체: 2단계는 1단계를 보상하므로 모집단에서 각 개인이 표집될 확률은 동일함

절차

  1. 각 계층(strata)의 표본 크기를 계산함

  2. 모집단 데이터를 계층으로 분리함. 다음 단계부터는 각 계층에 대해 적용되어야 함

  3. 주표집 단위(열 A)와 모집단 크기(열 B)를 나열함. 각 군집은 자체 군집 모집단 크기(a)가 있음

  4. 모집단 크기의 누적 합계를 계산함(열 C). 모집단 총계(b)는 열 C의 마지막에 나타남

  5. 각 계층에서 표집될 군집 수(d)를 결정함

  6. 각 군집에서 표집될 개인 수를 결정함(c). 모집단의 모든 개인이 군집 크기에 관계없이 동일한 선택 확률을 갖도록 하려면 각 군집에서 동일한 수의 개인을 표집해야 함

  7. 표집구간(Sampling Interval)을 구하려면 전체 모집단을 표집할 군집 수로 나눔

  8. 1과 표집구간 사이의 난수를 선택함. 이것이 무작위 시작(Random Start)임. 표집될 첫 번째 군집은 누적 모집단(C 열)이 포함됨.

    [Excel 명령어 = rand () SI]
    다음 시리즈를 계산함:
    RS;
    RS + SI;
    RS + 2SI;
    ….
    RS + (d-1)
    SI.RS + (d-1) * SI.

  9. 선택된 군집은 누적 모집단(열 C)에 항목 8에서 계산된 일련 번호 중 하나가 포함된 군집임. 군집의 모집단 크기에 따라 큰 군집은 두 번 이상 표집될 수 있음. 표집된 군집을 다른 열(열 D)에 표시함

  10. 표집된 각 군집에 대해 표집될 각 군집의 확률(Prob 1) (열 E)을 계산함

    Prob 1 = (a x d) ÷ b
    a = 군집 모집단
    b = 모집단 총계
    d = 군집 수

  11. 표집된 각각의 군집에 대해 각 군집에서 표집될 각 개인의 확률을 계산함(Prob 2) (열 G).

    Prob 2 = c / a
    a = 군집 모집단
    c = 각 군집에서 표집될 개인 수
    모집단에서 표집되는 개인의 전체 기본 가중치를 계산함
    기본 가중치(Basic Weight)는 선택의 역확률임
    BW = 1 / (prob 1 * prob 2)

예제:
30개의 군집에 20000명의 모집단이라고 가정함
PPS를 사용해 10개의 군집에 3000명의 표본을 산출하고자 함
Prob 1: 각 표본 군집에 대한 선택 확률
Prob 2: 각 표본 군집에서의 개인에 대한 선택 확률
전체 가중치 계산: 모집단에서 각 개인이 선택될 확률의 역

출처: Steps in applying Probability Proportional to Size (PPS) and calculating Basic Probability Weights

살인자O난감

살인자O난감
8부작

DP 이후 오랜만에 단숨에 다 본 드라마다. 우발적 살인, 온 우주가 살인을 숨겨주지만 형사의 감으로 탕이를 추적하면서 벌어지는 세상사. 정말 재미있다.