Encoding pohon biner


Misalkan Anda memiliki pohon biner lengkap (yaitu masing-masing simpul internal memiliki dua keturunan yang tidak kosong). Setiap node berisi bilangan nol. Anda diberi tugas untuk menyandikan dan mendekode pohon ke / dari daftar bilangan bulat.

Pohon disimpan secara internal seperti:

struct node {
  int data;
  struct node *left, *right;

Dan Anda harus mengimplementasikan dua fungsi:

int *encode(struct node *root);
struct node *decode(int *array);

Terserah Anda bagaimana Anda menyandikan dan memecahkan kode.

Poin untuk:

  • panjang penyandian minimum
  • kompleksitas (idealnya linear dalam jumlah node)
  • keaslian

Tidak ada poin untuk panjang kode sumber dan Anda tidak terbatas pada C.

Contoh pohon:

    / \
   3   2
      / \
     2   1
    / \
   9   9

Persyaratan input dan output tidak ada salahnya.
Yasir Arsanukaev

@Yasir: Algoritma penyandian adalah pekerjaan Anda sehingga saya tidak dapat memberikan input dan output. int *adalah kotak hitam untuk pengguna.

Apakah ada batasan rentang bilangan bulat? Lebih khusus lagi jika kita menggunakan bahasa dengan bilangan bulat besar secara acak, apakah kita diizinkan memanfaatkannya? Dan apakah ukuran data yang dikodekan diukur dalam jumlah bilangan bulat atau jumlah byte?

Apakah fungsi encode dan decode harus bebas efek samping (selain alokasi memori)? Atau bisakah mereka misalnya menyimpan data dalam variabel global?

Dengan asumsi integer data itu sendiri adalah integer 32-bit yang sebenarnya, ada pengkodean sederhana yang hanya menggunakan 32 * n bit.



~ 1,03 N

Tampaknya semua jawaban sejauh ini membutuhkan setidaknya 2 * N * 32-bit untuk disimpan. (Kecuali solusi dalam bahasa yang memungkinkan nilai integer lebih panjang dari 32 bit, seperti solusi Haskell dan Ruby - tetapi itu masih akan mengambil byte tambahan untuk menyandikan kapan pun data lebih besar dari 16K.)

Berikut adalah solusi yang hanya membutuhkan N + langit-langit (N / 32) +1 penyimpanan int. Ini mendekati 1,03125 N untuk N besar, dan di bawah 1,1 N untuk semua N lebih besar dari 20.

Idenya adalah untuk menyimpan bit ekstra untuk setiap node di mana 1 adalah "hasChildren". Bit-bit ini dikemas dalam N / 32 kata di depan.

int* encodeHelper(Node* n, int* code, int* pos, int* flag)
   int hasKids = (n->left!=0);
   if (hasKids) bencodeHelper(n->left, code, pos, flag);
   if (hasKids) bencodeHelper(n->right, code, pos, flag);
   return code;

int* encode(Node* h, int* sizeOut)
   int nnodes=countNodes(h);
   int nflags = (int)ceil(nnodes/32.0);
   int pos=nflags+1;
   int flag=32;
   int* out;
   *sizeOut = 1+nnodes+nflags;
   out = calloc(*sizeOut, sizeof(int));
   if (!h) return out;
   out[0]=nflags+1; //store start of data
   return encodeHelper(h,out,&pos,&flag);

Node* decodeHelper(int* code, int* pos, int* flag)
   Node*n = calloc(1, sizeof(Node));
   int hasKids = code[*flag/32]>>(*flag&31)&1;
   if (hasKids) n->left = bdecodeHelper(code, pos, flag);
   n->data = code[*pos];
   if (hasKids) n->right = bdecodeHelper(code, pos, flag);
   return n;

Node* decode(int* code)
   int flag=32;
   int pos=code[0];
   if (!pos) return NULL;
   return decodeHelper(code, &pos, &flag);

(selesaikan implementasi di sini)


Program Haskell ini mengkodekan sebuah pohon n node di n Integer. Kuncinya adalah bahwa itu mengkode data node dua kali lipat, dan kemudian menggunakan bit orde rendah untuk menunjukkan apakah ini adalah node daun, atau node interior.

Secara teknis, Parsermonad di sini adalah over-kill, karena hanya ada satu parser yang dibuat, decoderdan saya bisa meletakkan logika rantai parser langsung di sana. Tapi cara dekoder ini sangat jelas, dan Parsermeskipun ukurannya kecil, adalah kerangka kerja penguraian sederhana yang masuk akal.

import Control.Monad (ap)

data Tree = Leaf Integer | Node Integer Tree Tree
  deriving (Eq, Show)

encode :: Tree -> [Integer]
encode (Leaf n)     = [n*2]
encode (Node n t u) = (n*2+1) : encode t ++ encode u

decode :: [Integer] -> Maybe Tree
decode = fullyParse decoder
    decoder :: Parser Integer Tree
    decoder = do
      i <- next
      let n = i `div` 2
      if even i
        then return (Leaf n)
        else return (Node n) `ap` decoder `ap` decoder

-- A simple Parsing Monad
data Parser a b = P { runParser :: [a] -> Maybe (b, [a]) }

instance Monad (Parser a) where
  return a = P ( \ts -> Just (a, ts) )
  p >>= q  = P ( \ts -> runParser p ts >>= (\(v,ts') -> runParser (q v) ts') )
  fail _   = P ( const Nothing )

next :: Parser a a
next = P n
 where n (t:ts) = Just (t,ts)
       n _      = Nothing

fullyParse :: Parser a b -> [a] -> Maybe b
fullyParse p ts = runParser p ts >>= consumedResult
    consumedResult (v,[]) = Just v
    consumedResult _      = Nothing

-- Example
main :: IO ()
main = do
    putStrLn $ "example:  " ++ show ex
    putStrLn $ "encoding: " ++ show encEx
    putStrLn $ "decoding: " ++ show decEx
    putStrLn $ "worked?   " ++ show worked
    ex = Node 5
          (Leaf 3)
          (Node 2
            (Node 2
              (Leaf 9)
              (Leaf 9)
            (Leaf 1)
    encEx = encode ex
    decEx = decode encEx
    worked = maybe False (ex ==) decEx

Menjalankan ini membuat Anda:

> runhaskell TreeEncoding.hs 
example:  Node 5 (Leaf 3) (Node 2 (Node 2 (Leaf 9) (Leaf 9)) (Leaf 1))
encoding: [11,6,5,5,18,18,2]
decoding: Just (Node 5 (Leaf 3) (Node 2 (Node 2 (Leaf 9) (Leaf 9)) (Leaf 1)))
worked?   True


Dalam C

#include <stdlib.h>
#include <stdio.h>

struct Node;
typedef struct Node Node;

struct Node
    int   data;
    Node* left;
    Node* right;
/* Private Functions */
static int*  encodeNode(Node* tree, int* store);
static Node* decodeNode(int** store);

/* Public Functions */
Node*   newNode(int data,Node* left,Node* right);
void    deleteTree(Node* tree);
int     countNodesTree(Node* tree);
int*    encode(Node *tree);
Node*   decode(int* store);
void    printTree(Node* tree);

Node* newNode(int data,Node* left,Node* right)
    Node* result    = (Node*)malloc(sizeof(Node));
    result->data    = data;
    result->left    = left;
    result->right   = right;

    return result;

void deleteTree(Node* tree)
    if (tree == NULL)
    {   return;


int countNodesTree(Node* tree)
    if (tree == NULL)
    {   return 0;

    return    countNodesTree(tree->left)
            + countNodesTree(tree->right)
            + 1;

void printTree(Node* tree)
    if (tree == NULL)
        fprintf(stdout, "- ");
        fprintf(stdout, "%d ", tree->data);


int* encode(Node *tree)
    int     nodeCount   = countNodesTree(tree);
    int*    result      = (int*)malloc(sizeof(int) * (nodeCount * 2 + 1));

    // Put the node count in the first element.
    // This makes it easy to also serialize this object for transport
    // i.e. you can put it in a file or a stream (socket) and easily recover it.
    result[0]           = nodeCount;
    encodeNode(tree, result + 1);
    return result;

int* encodeNode(Node* tree, int* store)
    if (tree != NULL)
        store[0]    = tree->data;
         * Slight overkill. for this question.
         * But works and makes future enhancement easy
        store[1]    = (tree->left  == NULL ? 0 : 1)
                    + (tree->right == NULL ? 0 : 2);
        store += 2;

        store       = encodeNode(tree->left,  store);
        store       = encodeNode(tree->right, store);
    return store;


Node* decode(int* store)
    if (store == NULL)
    { fprintf(stderr, "Bad Input terminating: encode() always return non NULL\n");

    if (store[0] == 0)
        return NULL;

    return decodeNode(&store);

Node* decodeNode(int** store)
    int     value   = (*store)[0];
    int     flag    = (*store)[1];
    (*store) += 2;

    Node*   left    = flag & 1 ? decodeNode(store) : NULL;
    Node*   right   = flag & 2 ? decodeNode(store) : NULL;

    return newNode(value, left, right);


int main()
    Node*   t = newNode(5,
                        newNode(3, NULL, NULL),
                                        newNode(9, NULL, NULL),
                                        newNode(9, NULL, NULL)
                                newNode(1, NULL, NULL)


    int*    e   = encode(t);
    Node*   d   = decode(e);


Catatan. Setiap node dikodekan sebagai dua bilangan bulat (ditambah satu int untuk hitungan node).
Jadi pohon yang disediakan mengkodekan seperti ini:

 7, 5, 3, 3, 0, 2, 3, 2, 3, 9, 0, 9, 0 1, 0
 ^  ^
 ^  ^ Node 1


Di Ruby, dengan penyandian yang sama dengan @MtnViewMark :

class Node
        def initialize(data, left = nil, right = nil)
                @data, @left, @right = data, left, right

        def encode
                "%d %s %s" % [@data<<1|1, @left.encode, @right.encode]

        class << self
                def decode(str)
                        _decode(str.split.map &:to_i)


                def _decode(a)
                        n = a.shift
                        if n & 1 == 1
                                Node.new(n>>1, _decode(a), _decode(a))

class Leaf < Node
        def encode

tree=Node.decode("11 6 5 5 18 18 2")
print tree.encode

Biaya adalah satu integer per node ( data << 1 | has_childs):

11 6 5 5 18 18 2

Wow - itu terlihat ramping dan elegan. Namun, tidak memerlukan Array int, bukan?
pengguna tidak diketahui


Diberi pohon biner dengan nnode, ini mengkodekannya dalam daftar 2n + 1bilangan bulat. Kedua algoritma encoding dan decoding memiliki O(n)kompleksitas.

Saya menggunakan 0 integer sebagai penanda sentinel saat menyandikan, menunjukkan saat saya membuka rekursi. Kemudian ketika saya decoding, saya meletakkan node pohon yang saya buat di stack (macam) dan menggunakan 0s dalam daftar untuk melacak di mana menambahkan node berikutnya. Saya belum mencoba, tapi saya cukup yakin decoding akan pecah jika pohon itu tidak lengkap.

#include <math.h>
#include <stdio.h>
#include <stdlib.h>

// Prototypes
struct BTnode;
struct BTnode * bt_add_left(struct BTnode * node, int data);
struct BTnode * bt_add_right(struct BTnode * node, int data);
int             bt_depth(struct BTnode * tree);
int             bt_encode_preorder(int * list, struct BTnode * tree, int index);
struct BTnode * bt_node_create(int data);
int             bt_node_delete(struct BTnode * node);
void            bt_print_preorder(struct BTnode * tree);
int *           encode(struct BTnode * tree);
struct BTnode * decode(int * list);

// Binary tree node
struct BTnode
  int data;
  struct BTnode *left, *right;

// Add node to this node's left
struct BTnode * bt_add_left(struct BTnode * node, int data)
  struct BTnode * newnode = bt_node_create(data);
  node->left = newnode;
  return newnode;

// Add node to this node's right
struct BTnode * bt_add_right(struct BTnode * node, int data)
  struct BTnode * newnode = bt_node_create(data);
  node->right = newnode;
  return newnode;

// Determine depth of the tree
int bt_depth(struct BTnode * tree)
  int depth;
  int leftdepth = 0;
  int  rightdepth = 0;
  if( tree == NULL ) return 0;

  if( tree->left != NULL )
    leftdepth = bt_depth(tree->left);
  if( tree->right != NULL )
    rightdepth = bt_depth(tree->right);

  depth = leftdepth;
  if(rightdepth > leftdepth)
    depth = rightdepth;

  return depth + 1;

// Recursively add node values to integer list, using 0 as an unfolding sentinel
int bt_encode_preorder(int * list, struct BTnode * tree, int index)
  list[ index++ ] = tree->data;

  // This assumes the tree is complete (i.e., if the current node does not have
  // a left child, then it does not have a right child either)
  if( tree->left != NULL )
    index = bt_encode_preorder(list, tree->left, index);
    index = bt_encode_preorder(list, tree->right, index);

  // Add sentinel
  list[ index++ ] = 0;
  return index;

// Allocate memory for a node
struct BTnode * bt_node_create(int data)
  struct BTnode * newnode = (struct BTnode *) malloc(sizeof(struct BTnode));
  newnode->left = NULL;
  newnode->right = NULL;
  newnode->data = data;
  return newnode;

// Free node memory
int bt_node_delete(struct BTnode * node)
  int data;
  if(node == NULL)
    return 0;
  data = node->data;

  if(node->left != NULL)
  if(node->right != NULL)

  return data;

// Print all values from the tree in pre-order
void bt_print_preorder(struct BTnode * tree)
  printf("%d ", tree->data);
  if(tree->left != NULL)
  if(tree->right != NULL)

// Decode binary tree structure from a list of integers
struct BTnode * decode(int * list)
  struct BTnode * tree;
  struct BTnode * nodestack[ list[0] ];
  int i,j;

  // Handle trivial case
  if( list == NULL ) return NULL;

  tree = bt_node_create( list[1] );
  nodestack[ 1 ] = tree;

  j = 1;
  for(i = 2; i < list[0]; i++)
    if( list[i] == 0 )
      if( nodestack[j]->left == NULL )
        //printf("Adding %d to left of %d\n", list[i], nodestack[j]->data);
        nodestack[ j+1 ] = bt_add_left(nodestack[j], list[i]);
        //printf("Adding %d to right of %d\n", list[i], nodestack[j]->data);
        nodestack[ j+1 ] = bt_add_right(nodestack[j], list[i]);

  return tree;

// Encode binary tree structure as a list of integers
int * encode(struct BTnode * tree)
  int maxnodes, depth, length;
  int * list;
  int j;

  // Handle trivial case
  if(tree == NULL) return NULL;

  // Calculate maximum number of nodes in the tree from the tree depth
  maxnodes = 1;
  depth = bt_depth(tree);
  for(j = 0; j < depth; j++)
    maxnodes += pow(2, j);

  // Allocate memory for the list; we need two ints for each value plus the
  // first value in the list to indicate length
  list = (int *) malloc( ((maxnodes * 2)+1) * sizeof(int));
  length = bt_encode_preorder(list, tree, 1);
  list[ 0 ] = length;
  return list;

int main()
  struct BTnode * tree;
  struct BTnode * newtree;
  int * list;
  int i;

  /* Provided example

       / \
      3   2
         / \
        2   1
       / \
      9   9
  tree = bt_node_create(5);
  bt_add_left(tree, 3);
  struct BTnode * temp = bt_add_right(tree, 2);
  bt_add_right(temp, 1);
  temp = bt_add_left(temp, 2);
  bt_add_left(temp, 9);
  bt_add_right(temp, 9);
  printf("T (traversed in pre-order):  ");

  list = encode(tree);
  printf("T (encoded as integer list): ");
  for(i = 1; i < list[0]; i++)
    printf("%d ", list[i]);

  newtree = decode(list);
  printf("T' (decoded from int list):  ");

  // Free memory
  return 0;

Disimpan ini encode.csaat dikompilasi dan dieksekusi. Program ini menggunakan contoh pohon yang Anda berikan, dan saya telah berhasil mengujinya pada beberapa orang lain.

$ gcc -Wall -lm -o encode encode.c
$ ./encode 
T (traversed in pre-order):  5 3 2 2 9 9 1 
T (encoded as integer list): 5 3 0 2 2 9 0 9 0 0 1 0 0 0 
T' (decoded from int list):  5 3 2 2 9 9 1

Cukup banyak yang ada dalam pikiran saya :).

bukankah ini akan gagal decoding jika data mengandung 0?

@ Ashelly Dia secara eksplisit mengatakan bahwa 0 tidak akan dimasukkan dalam pohon. Jika ya, maka ya ini akan gagal.
Daniel Standage


Kode saya mengkodekan pohon dalam travers preorder, masing-masing daun dalam dua int (datanya diikuti oleh 0) dan setiap node internal dalam satu int (datanya diikuti oleh anak kirinya, lalu kanan). Untuk pohon biner lengkap (seperti yang Anda definisikan) dengan n node, n harus ganjil, dan ada (n + 1) / 2 daun dan (n-1) / 2 node internal, jadi itu 3n / 2 + 1 / 2 bilangan bulat untuk penyandian.

peringatan: belum diuji, ketikkan saja.

struct node {
  int data;
  struct node *left, *right;

void encodeInternal(struct node *root, vector<int> *buf) {
  if (root->left) {
    encodeInternal(root->left, buf);
    encodeInternal(root->right, buf);
  } else {
int *encode(struct node *root) {
  vector<int> buf;
  encodeInternal(root, &buf);
  return &buf[0];

struct decodeResult {
  int encoded_size;
  struct node *n;
struct decodeResult decodeInternal(int *array) {
  struct node *n = (struct node*)malloc(sizeof(struct node));
  n->data = array[0];
  if (array[1] == 0) {
    n->left = n->right = NULL;
    return (decodeResult){2, n};
  } else {
    decodeResult L = decodeInternal(array + 1);
    decodeResult R = decodeInternal(array + 1 + L.encoded_size);
    n->left = L.n;
    n->right = R.n;
    return (decodeResult){1 + L.encoded_size + R.encoded_size, n};
struct node *decode(int *array) {
  return decodeInternal(array).n;


Inilah usaha saya. Ini menyimpan pohon dalam array ukuran 2 ** kedalaman + 1. Ini digunakan a[0]untuk menahan ukuran, dan a[size]untuk menahan indeks "simpul kosong" pertama yang ditemuinya dalam traversal kedalaman-pertama. (Node kosong adalah tempat di mana seorang anak akan disimpan jika orang tuanya memilikinya). Setiap node kosong menyimpan indeks dari node kosong berikutnya yang akan ditemui.

Skema ini menghindari pemesanan bit untuk menandai anak-anak presense, sehingga setiap node dapat menggunakan rentang integer penuh. Ini juga memungkinkan pohon tidak seimbang - orangtua hanya dapat memiliki satu anak.


empty tree:  [0]
head node only:  [2,5,0]
example tree: [16,5,3,2,5,14,2,1,0,0, 0,0,9,9,15,0,4];


 int findDepth(Node* n) {
    int l = 0 ,r = 0;
    if (n) {
       l = 1 + findDepth(n->left);
       r = 1 + findDepth(n->right);
    return ( l > r ) ? l : r;

//Encode Function
 int* encodeTree(Node* head) {
    int* out;
    int depth = findDepth(head);
    int size = depth>0;
    while (depth--) size*=2;
    out = calloc(size+1,sizeof(int));
    encodeNode(head, out,1, out+size);
    return out;

 void encodeNode(Node* n, int* a, int idx, int* pEmpty) {
    if (n) {
    else if (idx<a[0]) {
       *pEmpty = idx;
       pEmpty = a+idx;


 //Decode Function
 Node* decodeArray(int* a) {
    return (a[0]) ?  decodeNode(a,1,a+a[0]) : NULL;

 Node* decodeNode(int* a, int idx, int* pEmpty) {
    Node* n = NULL;
    if (idx== *pEmpty)
    else {
       n = calloc(1,sizeof(Node));
       n->data = a[idx];
       if (idx*2<a[0]) {
          n->left = decodeNode(a, idx*2, pEmpty);
          n->right = decodeNode(a, idx*2+1, pEmpty);
    return n;

(terima kasih @daniel sobral untuk memperbaiki pemformatan)



trait Node {
  def encode (): Array[Int]

case object Node {
  def decode (a: Array[Int]): InnerNode = {
    if (a.length == 1) InnerNode (a(0)) else {
      val r = InnerNode (a(1)) 
      val l = decode (a.tail.tail) 
      InnerNode (a(0), l, r) 

case object Leaf extends Node {
  def encode (): Array[Int] = Array.empty

case class InnerNode (val data: Int, var l: Node=Leaf, var r: Node=Leaf) extends Node {
  def encode (): Array[Int] = Array (data) ++ r.encode () ++ l.encode () 

object BinTreeTest extends App {
  println (Node.decode (Array (1, 2, 3, 4, 5)).encode.mkString (", "))

Ini adalah pendekatan yang menggunakan sintaks usang, tetapi mengkompilasi tanpa kesalahan di Scala 2.9.1. Ini menghasilkan Pohon dan menerjemahkan setiap Pohon yang dikodekan ke Array yang sama seperti yang digunakan untuk pengkodean. Mungkin saya entah bagaimana menyingkirkan peringatan yang sudah usang hari ini.

Wow - itu yang sederhana. Gagasan pertama bekerja segera.

