应用安全 --- 安卓加固之 SO脱壳通用方法

一、整体思路

text

┌─────────────────────────────────────────────────┐
│              SO脱壳方法分类                       │
├──────────┬──────────┬──────────┬────────────────┤
│  动态dump │  静态分析 │ 模拟执行  │  内存重建       │
│  (推荐)   │  (困难)   │  (折中)   │  (最完整)       │
└──────────┴──────────┴──────────┴────────────────┘

二、动态Dump方法（最推荐）

方法1：Frida Hook dump

JavaScript

// dump_so.js - 最常用的方案
function dump_so(so_name) {
    var module = Process.findModuleByName(so_name);
    if (!module) {
        console.log("[-] Module not found: " + so_name);
        return;
    }

    console.log("[+] Module: " + module.name);
    console.log("[+] Base: " + module.base);
    console.log("[+] Size: " + module.size);

    // 方式一：整块dump
    var buf = Memory.readByteArray(module.base, module.size);
    var file = new File("/data/local/tmp/" + so_name + ".dump", "wb");
    file.write(buf);
    file.flush();
    file.close();
    console.log("[+] Dumped to /data/local/tmp/" + so_name + ".dump");
}

// 时机1：Hook dlopen 在加载完成后dump
function hook_dlopen() {
    var android_dlopen_ext = Module.findExportByName(null, "android_dlopen_ext");
    if (android_dlopen_ext) {
        Interceptor.attach(android_dlopen_ext, {
            onEnter: function(args) {
                this.path = args[0].readCString();
            },
            onLeave: function(retval) {
                if (this.path && this.path.indexOf("libtarget") !== -1) {
                    console.log("[+] Target SO loaded: " + this.path);
                    // 延时等待init完成（壳解密通常在init中）
                    setTimeout(function() {
                        dump_so("libtarget.so");
                    }, 3000);
                }
            }
        });
    }
}

// 时机2：Hook JNI_OnLoad（init之后执行，壳已解密）
function hook_jni_onload() {
    var dlsym = Module.findExportByName(null, "dlsym");
    Interceptor.attach(dlsym, {
        onEnter: function(args) {
            this.sym = args[1].readCString();
        },
        onLeave: function(retval) {
            if (this.sym === "JNI_OnLoad" && !retval.isNull()) {
                console.log("[+] JNI_OnLoad at: " + retval);
                Interceptor.attach(retval, {
                    onEnter: function(args) {
                        console.log("[+] JNI_OnLoad called, dumping...");
                        dump_so("libtarget.so");
                    }
                });
            }
        }
    });
}

// 时机3：Hook mprotect 监控壳的解密操作
function hook_mprotect() {
    var mprotect = Module.findExportByName(null, "mprotect");
    var count = 0;
    Interceptor.attach(mprotect, {
        onEnter: function(args) {
            var addr = args[0];
            var size = args[1].toInt32();
            var prot = args[2].toInt32();
            console.log("[mprotect] addr=" + addr + 
                       " size=0x" + size.toString(16) + 
                       " prot=" + prot);
            count++;
        },
        onLeave: function(retval) {
            // 壳通常会多次调用mprotect
            // 最后一次通常是恢复权限，此时已解密完成
            if (count >= 3) {
                dump_so("libtarget.so");
                count = -999; // 防止重复dump
            }
        }
    });
}

// 启动
hook_dlopen();
hook_jni_onload();

Bash

# 使用方式
frida -U -f com.example.app -l dump_so.js --no-pause

方法2：基于 /proc/pid/maps 的dump

Python

#!/usr/bin/env python3
"""
通过adb直接从进程内存dump SO
"""
import subprocess
import re
import struct
import sys

def adb_shell(cmd):
    result = subprocess.run(
        ["adb", "shell", "su", "-c", cmd],
        capture_output=True, text=True
    )
    return result.stdout

def find_pid(package_name):
    output = adb_shell(f"pidof {package_name}")
    return output.strip()

def dump_so_from_memory(package_name, so_name, output_path):
    pid = find_pid(package_name)
    if not pid:
        print(f"[-] Process not found: {package_name}")
        return False
    
    print(f"[+] PID: {pid}")
    
    # 读取 /proc/pid/maps
    maps = adb_shell(f"cat /proc/{pid}/maps")
    
    # 解析目标SO的内存映射
    regions = []
    base_addr = None
    
    for line in maps.split('\n'):
        if so_name in line:
            match = re.match(
                r'([0-9a-f]+)-([0-9a-f]+)\s+(\S+)\s+(\S+)\s+(\S+)\s+(\S+)\s*(.*)', 
                line
            )
            if match:
                start = int(match.group(1), 16)
                end = int(match.group(2), 16)
                perms = match.group(3)
                offset = int(match.group(4), 16)
                
                if base_addr is None:
                    base_addr = start
                
                regions.append({
                    'start': start,
                    'end': end,
                    'size': end - start,
                    'perms': perms,
                    'offset': offset,
                })
                print(f"  {line.strip()}")
    
    if not regions:
        print(f"[-] SO not found in memory maps: {so_name}")
        return False
    
    # 逐区域dump
    total_size = regions[-1]['end'] - base_addr
    print(f"\n[+] Total size: 0x{total_size:x}")
    print(f"[+] Base address: 0x{base_addr:x}")
    
    # 使用dd从/proc/pid/mem读取
    remote_path = f"/data/local/tmp/{so_name}.dump"
    
    for region in regions:
        offset = region['start'] - base_addr
        size = region['size']
        
        cmd = (f"dd if=/proc/{pid}/mem "
               f"bs=1 skip={region['start']} count={size} "
               f">> {remote_path} 2>/dev/null")
        adb_shell(cmd)
        print(f"  Dumped 0x{offset:x} - 0x{offset+size:x} ({region['perms']})")
    
    # Pull到本地
    subprocess.run(["adb", "pull", remote_path, output_path])
    print(f"\n[+] Saved to {output_path}")
    
    return True

if __name__ == '__main__':
    dump_so_from_memory(
        sys.argv[1],  # package name
        sys.argv[2],  # so name
        sys.argv[3]   # output path
    )

方法3：GDB/LLDB dump

Bash

# 附加到进程
adb forward tcp:23456 tcp:23456
adb shell su -c "gdbserver64 :23456 --attach $(pidof com.example.app)"

# 本地GDB连接
gdb-multiarch
(gdb) target remote :23456
(gdb) info proc mappings
(gdb) dump binary memory /tmp/libtarget.dump 0x7000000000 0x7000100000

三、Dump后的SO修复（关键步骤）

从内存dump出来的SO 不能直接使用，需要修复：

Python

#!/usr/bin/env python3
"""
SO Dump文件修复工具
将内存dump的SO修复为可静态加载的SO文件
"""
import struct
import sys
import os
from collections import OrderedDict


class SOFixer:
    """
    修复从内存dump出来的SO文件
    
    主要修复项:
    1. 修复ELF头中的节区表
    2. 修复Program Header的文件偏移
    3. 修复.dynamic段中的地址引用
    4. 重建Section Header Table
    5. 修复重定位表
    """
    
    PT_NULL = 0
    PT_LOAD = 1
    PT_DYNAMIC = 2
    PT_INTERP = 3
    PT_NOTE = 4
    PT_PHDR = 6
    PT_GNU_EH_FRAME = 0x6474e550
    PT_GNU_STACK = 0x6474e551
    PT_GNU_RELRO = 0x6474e552
    
    DT_NULL = 0
    DT_NEEDED = 1
    DT_PLTRELSZ = 2
    DT_PLTGOT = 3
    DT_HASH = 4
    DT_STRTAB = 5
    DT_SYMTAB = 6
    DT_RELA = 7
    DT_RELASZ = 8
    DT_RELAENT = 9
    DT_STRSZ = 10
    DT_SYMENT = 11
    DT_INIT = 12
    DT_FINI = 13
    DT_SONAME = 14
    DT_REL = 17
    DT_RELSZ = 18
    DT_RELENT = 19
    DT_PLTREL = 20
    DT_JMPREL = 23
    DT_INIT_ARRAY = 25
    DT_FINI_ARRAY = 26
    DT_INIT_ARRAYSZ = 27
    DT_FINI_ARRAYSZ = 28
    DT_GNU_HASH = 0x6ffffef5
    DT_VERSYM = 0x6ffffff0
    DT_VERNEED = 0x6ffffffe
    DT_VERNEEDNUM = 0x6fffffff
    
    def __init__(self, dump_path, base_addr=0, original_so=None):
        self.dump_path = dump_path
        self.base_addr = base_addr
        self.original_so = original_so
        
        with open(dump_path, 'rb') as f:
            self.data = bytearray(f.read())
        
        self.original_data = None
        if original_so and os.path.exists(original_so):
            with open(original_so, 'rb') as f:
                self.original_data = bytearray(f.read())
        
        # 解析基本信息
        self.is_64bit = self.data[4] == 2
        self.is_le = self.data[5] == 1
        self.endian = '<' if self.is_le else '>'
        
        self.ptr_size = 8 if self.is_64bit else 4
        self.ptr_fmt = 'Q' if self.is_64bit else 'I'
        
    def read_ptr(self, offset):
        fmt = f'{self.endian}{self.ptr_fmt}'
        return struct.unpack_from(fmt, self.data, offset)[0]
    
    def write_ptr(self, offset, value):
        fmt = f'{self.endian}{self.ptr_fmt}'
        struct.pack_into(fmt, self.data, offset, value)
    
    def read_u32(self, offset):
        return struct.unpack_from(f'{self.endian}I', self.data, offset)[0]
    
    def write_u32(self, offset, value):
        struct.pack_into(f'{self.endian}I', self.data, offset, value)
    
    def read_u16(self, offset):
        return struct.unpack_from(f'{self.endian}H', self.data, offset)[0]
    
    def parse_elf_header(self):
        """解析ELF头"""
        if self.is_64bit:
            self.e_type = self.read_u16(16)
            self.e_machine = self.read_u16(18)
            self.e_entry = self.read_ptr(24)
            self.e_phoff = self.read_ptr(32)
            self.e_shoff = self.read_ptr(40)
            self.e_ehsize = self.read_u16(52)
            self.e_phentsize = self.read_u16(54)
            self.e_phnum = self.read_u16(56)
            self.e_shentsize = self.read_u16(58)
            self.e_shnum = self.read_u16(60)
            self.e_shstrndx = self.read_u16(62)
        else:
            self.e_type = self.read_u16(16)
            self.e_machine = self.read_u16(18)
            self.e_entry = self.read_ptr(24)
            self.e_phoff = self.read_ptr(28)
            self.e_shoff = self.read_ptr(32)
            self.e_ehsize = self.read_u16(40)
            self.e_phentsize = self.read_u16(42)
            self.e_phnum = self.read_u16(44)
            self.e_shentsize = self.read_u16(46)
            self.e_shnum = self.read_u16(48)
            self.e_shstrndx = self.read_u16(50)
        
        print(f"[*] ELF {'64' if self.is_64bit else '32'}-bit")
        print(f"[*] Entry: 0x{self.e_entry:x}")
        print(f"[*] PHDR: off=0x{self.e_phoff:x} num={self.e_phnum} "
              f"entsize={self.e_phentsize}")
        print(f"[*] SHDR: off=0x{self.e_shoff:x} num={self.e_shnum} "
              f"entsize={self.e_shentsize}")
    
    def parse_program_headers(self):
        """解析程序头"""
        self.phdrs = []
        
        for i in range(self.e_phnum):
            off = self.e_phoff + i * self.e_phentsize
            
            if self.is_64bit:
                p_type = self.read_u32(off)
                p_flags = self.read_u32(off + 4)
                p_offset = self.read_ptr(off + 8)
                p_vaddr = self.read_ptr(off + 16)
                p_paddr = self.read_ptr(off + 24)
                p_filesz = self.read_ptr(off + 32)
                p_memsz = self.read_ptr(off + 40)
                p_align = self.read_ptr(off + 48)
            else:
                p_type = self.read_u32(off)
                p_offset = self.read_ptr(off + 4)
                p_vaddr = self.read_ptr(off + 8)
                p_paddr = self.read_ptr(off + 12)
                p_filesz = self.read_ptr(off + 16)
                p_memsz = self.read_ptr(off + 20)
                p_flags = self.read_u32(off + 24)
                p_align = self.read_ptr(off + 28)
            
            phdr = {
                'type': p_type,
                'flags': p_flags,
                'offset': p_offset,
                'vaddr': p_vaddr,
                'paddr': p_paddr,
                'filesz': p_filesz,
                'memsz': p_memsz,
                'align': p_align,
                'hdr_offset': off,
            }
            self.phdrs.append(phdr)
        
        return self.phdrs
    
    def fix_program_headers(self):
        """
        修复1: 将Program Header中的地址转换为文件偏移
        
        内存dump时 p_offset 可能等于 p_vaddr（因为是从内存映射的）
        需要将 p_vaddr 减去 base_addr 得到正确的文件偏移
        """
        print("\n[*] Fixing Program Headers...")
        
        for i, phdr in enumerate(self.phdrs):
            if phdr['type'] == self.PT_NULL:
                continue
            
            old_offset = phdr['offset']
            
            # 内存dump中，offset通常等于vaddr
            # 需要转换回文件偏移
            if self.base_addr > 0:
                new_offset = phdr['vaddr'] - self.base_addr
            else:
                # 如果没有提供base_addr，使用第一个LOAD段推断
                if phdr['type'] == self.PT_LOAD and i == 0:
                    # 第一个LOAD段的offset通常为0
                    self.base_addr = phdr['vaddr']
                    new_offset = 0
                else:
                    new_offset = phdr['vaddr'] - self.base_addr
            
            if new_offset != old_offset and new_offset >= 0:
                phdr['offset'] = new_offset
                self._write_phdr_offset(phdr)
                print(f"  [{i}] offset: 0x{old_offset:x} -> 0x{new_offset:x}")
    
    def _write_phdr_offset(self, phdr):
        off = phdr['hdr_offset']
        if self.is_64bit:
            self.write_ptr(off + 8, phdr['offset'])
        else:
            self.write_ptr(off + 4, phdr['offset'])
    
    def parse_dynamic(self):
        """解析DYNAMIC段"""
        self.dynamic = OrderedDict()
        self.dynamic_entries = []
        
        dyn_phdr = None
        for phdr in self.phdrs:
            if phdr['type'] == self.PT_DYNAMIC:
                dyn_phdr = phdr
                break
        
        if not dyn_phdr:
            print("[-] No DYNAMIC segment found")
            return
        
        dyn_offset = dyn_phdr['offset']
        dyn_size = dyn_phdr['filesz']
        entry_size = 2 * self.ptr_size
        
        pos = dyn_offset
        while pos < dyn_offset + dyn_size:
            d_tag = self.read_ptr(pos)
            d_val = self.read_ptr(pos + self.ptr_size)
            
            self.dynamic_entries.append({
                'tag': d_tag,
                'val': d_val,
                'offset': pos,
            })
            self.dynamic[d_tag] = d_val
            
            if d_tag == self.DT_NULL:
                break
            pos += entry_size
        
        print(f"\n[*] DYNAMIC entries: {len(self.dynamic_entries)}")
        
        # 打印关键条目
        important_tags = {
            5: 'DT_STRTAB', 6: 'DT_SYMTAB', 4: 'DT_HASH',
            10: 'DT_STRSZ', 12: 'DT_INIT', 13: 'DT_FINI',
            17: 'DT_REL', 7: 'DT_RELA', 23: 'DT_JMPREL',
            25: 'DT_INIT_ARRAY', 26: 'DT_FINI_ARRAY',
            3: 'DT_PLTGOT',
        }
        
        for entry in self.dynamic_entries:
            tag = entry['tag']
            if tag in important_tags:
                print(f"  {important_tags[tag]:20s} = 0x{entry['val']:x}")
    
    def fix_dynamic_addresses(self):
        """
        修复2: DYNAMIC段中的虚拟地址引用
        
        内存中所有地址都是绝对地址（base + offset）
        需要转换回相对于base的偏移
        """
        print("\n[*] Fixing DYNAMIC addresses...")
        
        # 这些tag的值是虚拟地址，需要修正
        addr_tags = {
            self.DT_PLTGOT, self.DT_HASH, self.DT_STRTAB, 
            self.DT_SYMTAB, self.DT_RELA, self.DT_INIT, 
            self.DT_FINI, self.DT_REL, self.DT_JMPREL,
            self.DT_INIT_ARRAY, self.DT_FINI_ARRAY,
            self.DT_GNU_HASH, self.DT_VERSYM, self.DT_VERNEED,
        }
        
        for entry in self.dynamic_entries:
            if entry['tag'] in addr_tags and entry['val'] > self.base_addr:
                old_val = entry['val']
                new_val = old_val - self.base_addr
                
                self.write_ptr(entry['offset'] + self.ptr_size, new_val)
                entry['val'] = new_val
                
                print(f"  tag=0x{entry['tag']:x}: "
                      f"0x{old_val:x} -> 0x{new_val:x}")
    
    def rebuild_section_headers(self):
        """
        修复3: 重建Section Header Table
        
        加固壳通常会破坏或删除section headers
        通过DYNAMIC段信息重建
        """
        print("\n[*] Rebuilding Section Header Table...")
        
        sections = []
        
        # NULL section (必须是第一个)
        sections.append(self._make_section(
            name=b'\x00',
            sh_type=0,  # SHT_NULL
        ))
        
        # 从DYNAMIC段推断sections
        strtab = self.dynamic.get(self.DT_STRTAB, 0)
        strsz = self.dynamic.get(self.DT_STRSZ, 0)
        symtab = self.dynamic.get(self.DT_SYMTAB, 0)
        
        if symtab:
            syment = self.dynamic.get(self.DT_SYMENT, 
                                       24 if self.is_64bit else 16)
            # 推断符号表大小
            symtab_size = strtab - symtab if strtab > symtab else 0x1000
            
            sections.append(self._make_section(
                name=b'.dynsym\x00',
                sh_type=11,  # SHT_DYNSYM
                sh_offset=symtab - self.base_addr if symtab > self.base_addr else symtab,
                sh_size=symtab_size,
                sh_entsize=syment,
                sh_flags=2,  # SHF_ALLOC
                sh_link=len(sections) + 1,  # 指向.dynstr
            ))
        
        if strtab and strsz:
            sections.append(self._make_section(
                name=b'.dynstr\x00',
                sh_type=3,  # SHT_STRTAB
                sh_offset=strtab - self.base_addr if strtab > self.base_addr else strtab,
                sh_size=strsz,
                sh_flags=2,  # SHF_ALLOC
            ))
        
        # .rel.dyn 或 .rela.dyn
        rel = self.dynamic.get(self.DT_REL, 0)
        relsz = self.dynamic.get(self.DT_RELSZ, 0)
        rela = self.dynamic.get(self.DT_RELA, 0)
        relasz = self.dynamic.get(self.DT_RELASZ, 0)
        
        if rel and relsz:
            sections.append(self._make_section(
                name=b'.rel.dyn\x00',
                sh_type=9,  # SHT_REL
                sh_offset=rel - self.base_addr if rel > self.base_addr else rel,
                sh_size=relsz,
                sh_entsize=8,
                sh_flags=2,
            ))
        elif rela and relasz:
            sections.append(self._make_section(
                name=b'.rela.dyn\x00',
                sh_type=4,  # SHT_RELA
                sh_offset=rela - self.base_addr if rela > self.base_addr else rela,
                sh_size=relasz,
                sh_entsize=24 if self.is_64bit else 12,
                sh_flags=2,
            ))
        
        # .rel.plt / .rela.plt
        jmprel = self.dynamic.get(self.DT_JMPREL, 0)
        pltrelsz = self.dynamic.get(self.DT_PLTRELSZ, 0)
        pltrel = self.dynamic.get(self.DT_PLTREL, 0)
        
        if jmprel and pltrelsz:
            sh_type = 4 if pltrel == 7 else 9  # RELA or REL
            sections.append(self._make_section(
                name=b'.rel.plt\x00' if sh_type == 9 else b'.rela.plt\x00',
                sh_type=sh_type,
                sh_offset=jmprel - self.base_addr if jmprel > self.base_addr else jmprel,
                sh_size=pltrelsz,
                sh_entsize=24 if sh_type == 4 else 8,
                sh_flags=0x42,  # SHF_ALLOC | SHF_INFO_LINK
            ))
        
        # 从LOAD段推断 .text 和 .rodata
        for phdr in self.phdrs:
            if phdr['type'] == self.PT_LOAD:
                if phdr['flags'] & 1:  # PF_X - 可执行
                    sections.append(self._make_section(
                        name=b'.text\x00',
                        sh_type=1,  # SHT_PROGBITS
                        sh_offset=phdr['offset'],
                        sh_size=phdr['filesz'],
                        sh_flags=6,  # SHF_ALLOC | SHF_EXECINSTR
                        sh_addr=phdr['vaddr'] - self.base_addr,
                    ))
        
        # .dynamic
        for phdr in self.phdrs:
            if phdr['type'] == self.PT_DYNAMIC:
                sections.append(self._make_section(
                    name=b'.dynamic\x00',
                    sh_type=6,  # SHT_DYNAMIC
                    sh_offset=phdr['offset'],
                    sh_size=phdr['filesz'],
                    sh_entsize=2 * self.ptr_size,
                    sh_flags=3,  # SHF_WRITE | SHF_ALLOC
                ))
        
        # .got
        pltgot = self.dynamic.get(self.DT_PLTGOT, 0)
        if pltgot:
            sections.append(self._make_section(
                name=b'.got\x00',
                sh_type=1,  # SHT_PROGBITS
                sh_offset=pltgot - self.base_addr if pltgot > self.base_addr else pltgot,
                sh_size=0x100,  # 估算
                sh_flags=3,  # SHF_WRITE | SHF_ALLOC
            ))
        
        # 构建shstrtab
        shstrtab = bytearray(b'\x00')
        section_name_offsets = []
        for sec in sections:
            section_name_offsets.append(len(shstrtab))
            shstrtab.extend(sec['name_bytes'])
        
        # .shstrtab 自身
        shstrtab_name_off = len(shstrtab)
        shstrtab.extend(b'.shstrtab\x00')
        
        shstrtab_section = self._make_section(
            name=b'.shstrtab\x00',
            sh_type=3,  # SHT_STRTAB
            sh_offset=0,  # 稍后填充
            sh_size=len(shstrtab),
        )
        sections.append(shstrtab_section)
        section_name_offsets.append(shstrtab_name_off)
        
        # 将shstrtab和section headers追加到文件末尾
        # 对齐到4字节
        while len(self.data) % 4 != 0:
            self.data.append(0)
        
        shstrtab_file_offset = len(self.data)
        self.data.extend(shstrtab)
        
        # 更新shstrtab的offset
        shstrtab_section['sh_offset'] = shstrtab_file_offset
        
        # 对齐section header table
        while len(self.data) % self.ptr_size != 0:
            self.data.append(0)
        
        shdr_offset = len(self.data)
        
        # 写入section headers
        shstrndx = len(sections) - 1
        
        for i, sec in enumerate(sections):
            self._write_section_header(
                section_name_offsets[i],
                sec, 
            )
        
        # 更新ELF header
        if self.is_64bit:
            self.write_ptr(40, shdr_offset)   # e_shoff
            struct.pack_into(f'{self.endian}H', self.data, 58, 
                           64)                 # e_shentsize
            struct.pack_into(f'{self.endian}H', self.data, 60, 
                           len(sections))      # e_shnum
            struct.pack_into(f'{self.endian}H', self.data, 62, 
                           shstrndx)           # e_shstrndx
        else:
            self.write_ptr(32, shdr_offset)
            struct.pack_into(f'{self.endian}H', self.data, 46, 40)
            struct.pack_into(f'{self.endian}H', self.data, 48, 
                           len(sections))
            struct.pack_into(f'{self.endian}H', self.data, 50, 
                           shstrndx)
        
        print(f"[+] Rebuilt {len(sections)} sections")
        print(f"[+] Section headers at 0x{shdr_offset:x}")
    
    def _make_section(self, name, sh_type, sh_offset=0, sh_size=0,
                      sh_entsize=0, sh_flags=0, sh_link=0, sh_info=0,
                      sh_addr=0, sh_addralign=1):
        return {
            'name_bytes': name,
            'sh_type': sh_type,
            'sh_offset': sh_offset,
            'sh_size': sh_size,
            'sh_entsize': sh_entsize,
            'sh_flags': sh_flags,
            'sh_link': sh_link,
            'sh_info': sh_info,
            'sh_addr': sh_addr,
            'sh_addralign': sh_addralign,
        }
    def _write_section_header(self, name_offset, sec):
        """写入一个section header到文件末尾"""
        if self.is_64bit:
            hdr = struct.pack(f'{self.endian}IIQQQQIIQQ',
                name_offset,
                sec['sh_type'],
                sec['sh_flags'],
                sec['sh_addr'],
                sec['sh_offset'],
                sec['sh_size'],
                sec['sh_link'],
                sec['sh_info'],
                sec['sh_addralign'],
                sec['sh_entsize'],
            )
        else:
            hdr = struct.pack(f'{self.endian}IIIIIIIIII',
                name_offset,
                sec['sh_type'],
                sec['sh_flags'],
                sec['sh_addr'],
                sec['sh_offset'],
                sec['sh_size'],
                sec['sh_link'],
                sec['sh_info'],
                sec['sh_addralign'],
                sec['sh_entsize'],
            )
        self.data.extend(hdr)
    def fix_got_entries(self):
        """
        修复4: GOT表中的绝对地址
        运行时GOT被linker填充为绝对地址
        需要清零或恢复为PLT stub地址
        """
        print("\n[*] Fixing GOT entries...")
        pltgot = self.dynamic.get(self.DT_PLTGOT, 0)
        if not pltgot:
            return
        got_offset = pltgot - self.base_addr if pltgot > self.base_addr else pltgot
        if got_offset >= len(self.data):
            return
        # GOT前3个条目是保留的
        # GOT[0] = _DYNAMIC地址
        # GOT[1] = link_map指针  
        # GOT[2] = dl_resolve指针
        # 清零这些运行时值
        for i in range(3):
            pos = got_offset + i * self.ptr_size
            if pos + self.ptr_size <= len(self.data):
                self.write_ptr(pos, 0)
        print(f"  Cleared GOT reserved entries at 0x{got_offset:x}")
    def remove_init_hook(self):
        """
        修复5: 移除壳的DT_INIT hook
        壳通常劫持DT_INIT指向自己的解密函数
        解密完成后应恢复原始DT_INIT
        """
        print("\n[*] Checking DT_INIT...")
        init_val = self.dynamic.get(self.DT_INIT, 0)
        if init_val:
            # 检查DT_INIT是否指向壳代码
            # 壳代码通常在文件末尾或特殊段
            init_offset = init_val - self.base_addr if init_val > self.base_addr else init_val
            # 判断是否在正常代码范围内
            for phdr in self.phdrs:
                if (phdr['type'] == self.PT_LOAD and 
                    phdr['flags'] & 1):  # 可执行段
                    seg_start = phdr['offset']
                    seg_end = seg_start + phdr['filesz']
                    if seg_start <= init_offset < seg_end:
                        print(f"  DT_INIT 0x{init_val:x} is within "
                              f"executable segment - likely OK")
                        return
            print(f"  DT_INIT 0x{init_val:x} might be shell code")
            print(f"  Consider setting to 0 or original value")
    def fix_all(self):
        """执行所有修复"""
        print("=" * 60)
        print("SO Dump Fixer")
        print("=" * 60)
        self.parse_elf_header()
        self.parse_program_headers()
        self.fix_program_headers()
        self.parse_dynamic()
        self.fix_dynamic_addresses()
        self.fix_got_entries()
        self.remove_init_hook()
        self.rebuild_section_headers()
        return bytes(self.data)
    def save(self, output_path):
        with open(output_path, 'wb') as f:
            f.write(self.data)
        print(f"\n[+] Fixed SO saved to {output_path}")
        print(f"    Size: {len(self.data)} bytes")
def main():
    import argparse
    parser = argparse.ArgumentParser(description='SO Dump文件修复工具')
    parser.add_argument('input', help='dump的SO文件')
    parser.add_argument('output', help='修复后的输出文件')
    parser.add_argument('--base', type=lambda x: int(x, 0), default=0,
                       help='SO在内存中的基地址 (从maps获取)')
    parser.add_argument('--original', help='原始加固SO文件(用于参考)')
    args = parser.parse_args()
    fixer = SOFixer(args.input, args.base, args.original)
    fixer.fix_all()
    fixer.save(args.output)
if __name__ == '__main__':
    main()

四、模拟执行方法

方法4：使用Unicorn引擎

Python

#!/usr/bin/env python3
"""
使用Unicorn引擎模拟执行SO的init函数来完成脱壳
"""
from unicorn import *
from unicorn.arm64_const import *
import struct

class SOEmulator:
    """模拟执行SO的init函数"""
    
    STACK_ADDR = 0x80000000
    STACK_SIZE = 0x100000
    HEAP_ADDR  = 0x90000000
    HEAP_SIZE  = 0x1000000
    
    def __init__(self, so_path):
        with open(so_path, 'rb') as f:
            self.data = f.read()
        
        self.is_64bit = self.data[4] == 2
        
        if self.is_64bit:
            self.uc = Uc(UC_ARCH_ARM64, UC_MODE_ARM)
        else:
            self.uc = Uc(UC_ARCH_ARM, UC_MODE_ARM)
        
        self.heap_ptr = self.HEAP_ADDR
        self.syscall_hooks = {}
        
    def setup_memory(self):
        """设置内存映射"""
        # 映射SO到内存
        so_base = 0x40000000
        so_size = (len(self.data) + 0xFFF) & ~0xFFF
        
        self.uc.mem_map(so_base, so_size + 0x100000, 
                       UC_PROT_ALL)
        self.uc.mem_write(so_base, self.data)
        
        # 栈
        self.uc.mem_map(self.STACK_ADDR, self.STACK_SIZE,
                       UC_PROT_ALL)
        
        # 堆
        self.uc.mem_map(self.HEAP_ADDR, self.HEAP_SIZE,
                       UC_PROT_ALL)
        
        # 设置栈指针
        sp = self.STACK_ADDR + self.STACK_SIZE - 0x1000
        if self.is_64bit:
            self.uc.reg_write(UC_ARM64_REG_SP, sp)
        else:
            self.uc.reg_write(UC_ARM_REG_SP, sp)
        
        self.so_base = so_base
        return so_base
    
    def hook_syscalls(self):
        """Hook系统调用"""
        def hook_intr(uc, intno, user_data):
            if self.is_64bit:
                syscall_num = uc.reg_read(UC_ARM64_REG_X8)
                args = [uc.reg_read(r) for r in 
                       [UC_ARM64_REG_X0, UC_ARM64_REG_X1,
                        UC_ARM64_REG_X2, UC_ARM64_REG_X3]]
            
            # 模拟关键syscall
            if syscall_num == 222:  # mmap
                addr = args[0]
                size = args[1]
                result = self.heap_ptr
                self.heap_ptr += (size + 0xFFF) & ~0xFFF
                
                try:
                    uc.mem_map(result, (size + 0xFFF) & ~0xFFF, 
                             UC_PROT_ALL)
                except:
                    pass
                
                if self.is_64bit:
                    uc.reg_write(UC_ARM64_REG_X0, result)
                    
            elif syscall_num == 226:  # mprotect
                if self.is_64bit:
                    uc.reg_write(UC_ARM64_REG_X0, 0)
                    
            elif syscall_num == 56:   # openat
                if self.is_64bit:
                    uc.reg_write(UC_ARM64_REG_X0, 0xFFFFFFFF)
                    
            elif syscall_num == 215:  # munmap
                if self.is_64bit:
                    uc.reg_write(UC_ARM64_REG_X0, 0)
        
        self.uc.hook_add(UC_HOOK_INTR, hook_intr)
    
    def run_init(self, init_offset):
        """执行init函数"""
        start_addr = self.so_base + init_offset
        
        # 设置返回地址为一个终止地址
        end_addr = 0xDEAD0000
        self.uc.mem_map(end_addr & ~0xFFF, 0x1000, UC_PROT_ALL)
        
        if self.is_64bit:
            self.uc.reg_write(UC_ARM64_REG_LR, end_addr)
        
        try:
            self.uc.emu_start(start_addr, end_addr, 
                            timeout=30000000)
        except UcError as e:
            print(f"Emulation stopped: {e}")
        
        # dump解密后的内存
        so_size = (len(self.data) + 0xFFF) & ~0xFFF
        result = self.uc.mem_read(self.so_base, 
                                  so_size + 0x100000)
        return bytes(result[:len(self.data)])

五、现成工具

工具对比

工具	方法	适用场景	难度
SoFixer	dump修复	通用dump修复	⭐
Frida	动态hook	最通用	⭐⭐
QBDI	动态插桩	复杂壳	⭐⭐⭐
Unicorn	模拟执行	无需设备	⭐⭐⭐
IDA+脚本	静态分析	理解壳原理	⭐⭐⭐⭐

SoFixer（推荐）

Bash

# GitHub: https://github.com/maoabc/SoFixer
# 专门修复dump出来的SO

# 用法
./SoFixer -s dump.so -o fixed.so -m 0x7A000000 -d
# -s: 输入dump文件
# -o: 输出修复文件
# -m: 内存基地址
# -d: 添加section header

六、完整脱壳流程

text

┌─────────────────────────┐
│  1. 确定加固类型         │
│  (梆梆/360/爱加密/腾讯)  │
└──────────┬──────────────┘
           ▼
┌─────────────────────────┐
│  2. Frida dump内存       │
│  hook dlopen/JNI_OnLoad  │
│  等init完成后dump        │
└──────────┬──────────────┘
           ▼
┌─────────────────────────┐
│  3. 获取base地址         │
│  从/proc/pid/maps读取    │
└──────────┬──────────────┘
           ▼
┌─────────────────────────┐
│  4. SoFixer修复          │
│  修复PHDR/DYNAMIC/SHT   │
└──────────┬──────────────┘
           ▼
┌─────────────────────────┐
│  5. IDA验证              │
│  检查函数是否正确识别     │
└──────────┬──────────────┘
           ▼
┌─────────────────────────┐
│  6. 替换进APK            │
│  重新签名打包            │
└─────────────────────────┘

最可靠的方案是：Frida动态dump + SoFixer修复，这是工业界最常用的组合，成功率最高。静态分析解密仅在无法动态执行时才考虑使用。

GKLBB

导航

应用安全 --- 安卓加固 之 SO脱壳通用方法

一、整体思路

二、动态Dump方法（最推荐）

方法1：Frida Hook dump

方法2：基于 /proc/pid/maps 的dump

方法3：GDB/LLDB dump

三、Dump后的SO修复（关键步骤）

四、模拟执行方法

方法4：使用Unicorn引擎

五、现成工具

工具对比

SoFixer（推荐）

六、完整脱壳流程