본문 바로가기

전체 글

(28)
2025년 한 대학원생의 실존적 위기 "2025년 말에는 mid-level 소프트웨어 개발자들을 AI로 대체할것" - Mark zuckerberg"AI가 일자리 48%를 대체할 것" - Jensen Huang 위 발언은 IT 테크 기업에 관심이 있는 사람이라면 들어봤을 Meta와 NVIDIA의 CEO 저커버그와 젠슨 황이 2025년에 들어 한 이야기이다. 이러한 발언은 2010년 중반부터 시작된 AI의 기하급수적인 성장이 기저에 깔려있다. 물론 이들의 발언에 비지니스적 측면이 크게 반영되어 있다는 것을 배제할 순 없겠지만... 아니 뗀 굴뚝에 연기가 나랴... 참으로 진지한 철학적 문제는 오직 하나뿐이다.그것은 바로 자살이다.인생이 살 가치가 있느냐 없느냐를 판단하는 것이야말로 철학의 근본 문제에 답하는 것이다.시지프 신화 - 알베르 카뮈 ..
(한국어 번역) - i sensed anxiety and frustration at NeurIPS’24 역주 - (아래의 글은 필자가 ChatGPT에게 조경현 교수님의 "i sensed anxiety and frustration at NeurIPS’24"를 한국어 번역을 요청하여 얻은 결과로 원본과 내용이 다를 수 있습니다) 지난주 NeurIPS '24에서 특히 두드러졌던 점은, 졸업을 앞둔 박사 과정 학생들과 박사 후 연구원들이 느끼고 표현한 불안과 좌절감이었습니다. 이들은 5년 혹은 그 이상 전에 박사 과정을 신청할 당시 예상했던 것과는 크게 달라 보이고 느껴지는 현재의 취업 시장에 혼란스러워하고 있었습니다. 그중 일부는 제가 지도하고 있는 박사 과정 학생들이나 박사 후 연구원들이기도 해서, 저는 최근 인공지능 연구와 개발 분야에서 무슨 일이 벌어지고 있었는지, 혹은 벌어지고 있는지에 대해 고민해보게 ..
250110 - 사필귀정 거자필반 그리고 결자해지 0. 구글/애플 헬스장에서 트레이너로 근무하다 구글 헬스케어팀에서 researcher로 있다가 박사 공부하러 오는 Abraham이라는 친구가 싱가포르로 넘어왔다. 옛날에 대학에서 미식축구 팀 트레이너도 하고 NFL 선수들 코칭도 하고 했다는데 연구실 출근하기 시작하면 같이 운동가서 운동 좀 배워야겠다. 히히. 1. 요즘 문득 하는 생각인데 인생사가 참 사필귀정 거자필반이다.처음에는 만사가 올바르지 않은 것처럼 보여도 결국 "모든 일은 반드시 올바르게 돌아갈 것"이라는 뜻이다. 2. 중1까진 야구선수 하겠다고 운동만 하다가 피지컬이 기본인 동네에서 150cm도 안되는 꼬맹이는 1년 유급이 아니면 진학이 어려웠기게 부모님의 반대로 운동을 접었다. 이후론 스포츠 재활 의학 같은걸 하겠다고 의대를 목표로 공부를..
연구시 주의할 점 (1): 숫자의 함정에 빠지지 말기... 지금 논문 쓰다가 급하게 하나 기록해둬야겠다 싶어서 쓰러 왔다. 이번에 논문을 쓰다가 되게 Counter-intuitive한 결과를 하나 마주했다. 짧게 얘기하면 직관적으로나 이론적으로 dnn의 출력층의 레이어에서 오차가 많이 발생해야 하는 문제가 있는데, 오히려 입력층으로 갈수록 측정중인 metric이 높게 찍히는 문제가 발견됐다. 이리저리 해석을 하다보니 앞쪽층에서 나오는 결과들의 값들의 크기 자체가 뒷층보다 훨씬커서 mae 같은 metric을 찍으면 당연히 오차범위가 커지는 것 같았다. 뭐 키를 m대신 cm로 표현하면 숫자 자체는 커져서 분산이나 표준편차도 줄어들고 눈에 보이는 오차 자체도 0.xm 단위로 떨어지는 것과 동일한데, 어떤 분야든 그 단위가 명확하지 않은 경우가 다분히 존재하니 늘 여러..
Introduction to generative models 이번 학기에 generative model의 전반을 다루는 수업을 청강하게 됐다. 작년엔 vision transformer가 주된 주제였는데, 배울것이 많았던 수업이라 크게 관심은 없었지만 요즘 워낙 생성모델에 대한 이야기가 많이 나와 공부해볼겸 청강하게 됐다. 한 학기동안 약 30편에 달하는 논문을 읽게될 예정인데 그중 인상 깊은 논문들은 정리해두려고 한다. What is a generative model?생성 모델은 generative power를 가진 모든 모델을 의미한다고 한다. 강의를 듣기 전에는 generative model은 새로운 데이터를 만들어 내야한다고 생각을 했었는데, generative power를 가지는 것과 데이터를 generation하는 것과는 차이가 좀 있다고 한다...
텐서보드 로그 파일 .csv로 정리하기 (Tensorboard log to csv) 최근에 급하게 프로젝트 하나에 조인해서 일주일 정도 급하게 실험을 왕창 돌렸습니다. 저는 보통 학습과 관련된 정보들을 텐서보드를 통해서 기록해두는 편입니다. 텐서보드를 사용하는 이유로는 역시 학습중에 학습이 어떻게 되고 있는지 시각화도 잘 해주고 같은 metric에 대해서 다른 세팅을 한 실험들간 직관적인 비교가 가능한 것도 좋은 것 같습니다 WandB같은 다른 우수한 MLOps 툴들이 있지만 공부를 시작하던 당시에 텐서보드로 시작했기에 역시 익숙한 텐서보드에 손이 가는 것 같습니다. 아무튼 저렇게 많은 수의 실험을 돌리다 보니 나중에 실험 결과를 정리할 때 하나하나 수작업으로 처리하는 것은 절대로 불가능해 보였고, 이걸 .csv로 떨어뜨려서 작업을 해야겠다고 생각했는데, 텐서보드에서 csv를 다운 받으..
CT image의 Axial, Coronal axis 분류하기 반갑습니다... 요즘 몸도 안좋고 이리저리 바빠서 블로그는 쳐다볼 시간이 없네요. 최근 연구실에서 CT image 데이터셋을 다룰 일이 생겨서 작업하다 매우 귀찮은 작업이 있음을 인지하였습니다. CT 이미지는 아래 이미지 처럼 어떤 축을 기준으로 촬영되느냐에 따라서 볼 수 있는 구조가 달라지고, 따라서 목적에 따라 사용되는 이미지가 달라집니다. 따라서 '일반적인' 어디 공개되어 있는 CT 데이터들은 axial, coronal, sagittal인지 명시하거나 아예 다른 폴더에 저장되어 있는 경우가 많았던 것 같습니다. Kaggle과 같은 곳에서 볼 수 있는 오픈 데이터셋에서 여러 방향에서 촬영된 CT 이미지의 경우 대부분 그렇게 정리되어 있을 것 같습니다. 그런데 제가 병원으로부터 받은 데이터는 환자의 C..
TCP, HTTP, etc 터널링 with ngrok 오랜만에 또 기록해둘만한 것이 생겨서 키보드를 두드린다. 상황이 어찌저찌 잘 맞아서 핀란드 헬싱키에서 열린 Mobisys에서 데모를 발표할 기회가 생겼다. DNN offloading이 기본적으로 들어가는 연구여서 서로 다른 기기간의 소켓 통신이 들어가 있었는데, 컨퍼런스가 열린 헬싱키 대학의 wifi가 외부 접속을 위한 포트들을 싹다 막아둬서 구현해둔 코드가 동작하지 않았다. 덕분에 학회 첫날 숙소에서 해결책을 찾다가 발견한 것이 터널링, ngrok이라는 프로그램을 통해서 막혀있는 포트를 외부 서버를 통해 우회하여 접속할 수 있었다. 간단하게 사용했던 방법만 기록해두려고 한다. 기본적인 설치 및 실행 방법은 아래의 블로그를 참고하였다. https://yunwoong.tistory.com/131 ngrok..