본문 바로가기

Data/논문 & 모델 정리

(10)
[arxiv]Automated software vulnerability detection with machine learning 자동취약점 탐지 관련 논문이전에도 설명했지만 자동화 취약점 탐지에 제일 장점은 크게 세가지임 1. 사람의 노동이 필요하지않다2. 값이 싸다3. 취약점 탐지가 빠르다 본 논문에서는 두가지 방법으로 접근함 1. IR(Intermediate Representation)코드를 가지고 실험 [Build-based]2. 소스코드를 가지고 실험 [Source-based] 소스코드를 컴파일하면[소스코드] - [중간표현] - [기계어] 라는 과정이 있다.첫번째 방법은 여기서 *중간표현 코드를 사용을 하였다고한다. (사실 컴파일러쪽 공부를안했다면 알아보기 힘듬)*Clang의 LLVM 도구를 사용 1. Build-based build-based에서는 두가지 feature를 사용하였음. 첫번째는 CFG(Control-Flow..
[NDSS 2018] VulDeePecker: A Deep Learning-Based System for Vulnerability Detection 요약: 본 논문은 소스코드 기반 딥러닝을 활용한 자동 취약점 탐지 시스템을 제안함. 또한 소스코드를 나타낼수있는 새로운 개념인 Code Gadget을 만들어내며 딥러닝을 위한 데이터셋을 가공해서 제공. 딥러닝 알고리즘은 Bidirection Long Short Term Memory(BLSTM)을 사용하여 학습및 탐지를 함.기존의 제안된 기술보다 낮은 False Positive(FP), False Negative(FN)이 측정됨. 딥러닝 답게 두가지 단계로 나뉘어짐: Learning Phase, Detection Phase 사실상 본 논문에 가장 중요한 점은 : "어떻게 소스코드를 벡터화를 하여서 표현할것인가?" 라는게 제일 중요하다고 생각함.이 질문에 대해서는 저자들은 Code-gadget이라는걸 활용해..