nickeubank · September 12, 2017 18:39
diff --git a/functions.R b/functions.R
 stripAttributes <- function(g) {
  for (a in list.graph.attributes(g)) {
    g <- delete_graph_attr(g, a)
  }
  for (a in list.edge.attributes(g)) {
    g <- delete_edge_attr(g, a)
  } 
  for (a in list.vertex.attributes(g)) {
    if (a != "name") {
      g <- delete_vertex_attr(g, a)
    }
  }
  return(g)
 }

 makeNetwork <- function(nodes, ties, type, village) {
  g <- ties[ties$type == type,c("i","j")]
  n_no_interview <- length(unique(g$j[!g$j %in% nodes$i[nodes$interviewed]]))
  reciprocity_construct <- NA
  if (type %in% c("friend", "family", "lender", "solver", "speak")) {
    g <- graph.data.frame(g, vertices = nodes)
    if (type %in% c("friend", "family")) {
      reciprocity_construct <- reciprocity(g)
      g <- as.undirected(g, "mutual", edge.attr.comb = list("type" = "first"))
    }
    
    # Add friends and family that does not require
    # reciprocation (nick, sept 12, 2017)
    if (type %in% c("friends_nonrecip", "family_nonrecip")) {
       reciprocity_construct <- reciprocity(g)
       g <- as.undirected(g, "collapse", edge.attr.comb = list("type" = "first"))
    }
    
    g <- induced_subgraph(g, V(g)[V(g)$interviewed])
  } else if (type %in% c("Leader")) {
    leaders <- unique(g$j)
    g <- g[!g$i %in% leaders,]
    g <- graph.data.frame(g, vertices = nodes)
    g <- induced_subgraph(g, V(g)[V(g)$interviewed])
    low <- V(g)[degree(g,mode = "in") < 5]
    g <- g - E(g)[V(g) %->% low]
  } else {
    stop("Unsupported type")
  }
  g$etype <- type
  g$village <- village
  stats_construct <- data.frame(village = village, 
                                etype = type, 
                                reciprocity_construct = reciprocity_construct, 
                                n_no_interview = n_no_interview, 
                                stringsAsFactors = F)
  return(list(g = g, 
              stats_construct = stats_construct))
 }

 makeNetworks <- function(nodes, ties, village) {
  types <- c("family","friend","solver","lender","Leader", "speak", "friends_nonrecip", "family_nonrecip")
  
  networks <- lapply(types, makeNetwork, nodes = nodes, ties = ties, village = village)
  stats_construct <- lapply(networks, function(l) l$stats_construct)
  networks <- lapply(networks, function(l) l$g)
  
  names(networks) <- types
  stats_construct <- do.call(rbind, stats_construct)
  
  # distances network
  p <- as_data_frame(networks$family, what = "vertices")[,c("name","lon","lat","nodist")]
  colnames(p)[1] <- "i"
  sto <- as.data.frame(t(combn(p$i, 2)))
  colnames(sto) <- c("i","j")
  sto <- merge(sto, p)
  sto <- merge(sto, p, by.x = "j", by.y = "i")
  sto$weight <- sapply(1:nrow(sto), function(i) distGeo(sto[i,c("lon.x","lat.x")],sto[i,c("lon.y","lat.y")]))
  sto$weight[sto$nodist.x | sto$nodist.y] <- NA
  sto$weight[is.na(sto$weight)] <- mean(sto$weight, na.rm = T) # those that don't have coordinates get assigned mean distance
  sto <- sto[,c("i","j","weight")]
  networks$geo <- graph.data.frame(sto, 
                                   directed = F, 
                                   vertices = as_data_frame(networks$family, what = "vertices"))
  networks$geo$etype <- "geo"
  networks$geo$village <- village
  
  # union of all networks
  networks$union <- networks$family %u% 
    stripAttributes(networks$friend) %u% 
    as.undirected(stripAttributes(networks$solver), mode = "collapse") %u% 
    as.undirected(stripAttributes(networks$lender), mode = "collapse")
  networks$union <- simplify(networks$union)
  networks$union$etype <- "union"
  networks$union$village <- village

  # Union without requirement of reciprocity
  networks$union_nonrecip <- networks$family_nonrecip %u% 
    stripAttributes(networks$friend_nonrecip) %u% 
    as.undirected(stripAttributes(networks$solver), mode = "collapse") %u% 
    as.undirected(stripAttributes(networks$lender), mode = "collapse")
  networks$union_nonrecip <- simplify(networks$union_nonrecip)
  networks$union_nonrecip$etype <- "union_nonrecrip"
  networks$union_nonrecip$village <- village 
                       
  networks$strong_ties <- networks$family %u% stripAttributes(networks$friend)
  networks$strong_ties <- simplify(networks$strong_ties)
  networks$strong_ties$etype <- "strong_ties"
  
  networks$weak_ties <- networks$solver %u% stripAttributes(networks$lender)
  networks$weak_ties <- simplify(networks$weak_ties)
  networks$weak_ties$etype <- "weak_ties"
  
  networks$leader_obj <- networks$union
  networks$leader_obj <- networks$leader_obj - 
    difference(E(networks$leader_obj), 
               E(networks$leader_obj)[inc(V(networks$leader_obj)[is_leader_obj == 1])])
  networks$leader_obj$etype <- "leader_obj"
  
  n_no_interview <- nrow(nodes) - length(unique(ties$j[ties$j %in% nodes$i[nodes$interviewed]]))
  stats_construct <- rbind(stats_construct, 
                           data.frame(village = village, 
                                      etype = "union", 
                                      reciprocity_construct = NA, 
                                      n_no_interview = n_no_interview, 
                                      stringsAsFactors = F))
  
  return(list(networks = networks, 
              stats_construct = stats_construct))
 }


 cleanDf <- function(df) {
  cols <- c("IDLINE", "key", "connection", 
            "exist", "id", "confirmentryid",          
            "village", "family_name", "first_name", 
            "alias_name", "gender", "gender_rec", 
            "hh_quadrant", "hh_number", "confirm", 
            "newfamily", "newfirst", "newalias", 
            "newgender", "qa13relation", "lineperperson", 
            "connectionid", "fewconnections")
  nodes <- df[,which(!colnames(df) %in% cols)]
  nodes <- unique(nodes)
  if (length(unique(nodes$resid)) != nrow(nodes)) {
    dup <- table(nodes$resid)
    dup <- names(dup)[dup>1]
    stop("# unique ids: ", length(unique(nodes$resid)), 
         ",  # unique individual rows: ", nrow(nodes), "\n", 
         "IDs: ", paste(dup, collapse = ", "))
  }
  pol_index <- as.matrix(nodes[,c("qe2b_Attended", "qe2b_Contributesproject", 
                                  "qe2b_Contributedmember", "qe2b_Contributedlabour", "qe2b_Reportedlead", 
                                  "qe2b_Reportedgov")])
  nodes <- nodes[,c("i", "interviewed", "heard", "adopt", "age", "female", "income", "edu", "phone", "immigrant", 
                    "is_leader_obj", 
                    "sent", "pborrow", "plend", "picontact", 
                    "no_dk", "no_dksms", "no_phone", "no_worth", "no_way", 
                    "lon", "lat", "nodist", 
                    "efficacy_int", "efficacy_ext", 
                    "prosoc_dic", "prosoc_pub", "attend", "satisfaction", "satisfaction2")]
  nomiss <- nodes[!nodes$nodist,c("lon","lat")]
  nomiss <- geomean(nomiss)
  nodes$lon[nodes$nodist] <- nomiss[1,1]
  nodes$lat[nodes$nodist] <- nomiss[1,2]
  nodes$adopt[is.na(nodes$adopt)] <- F
  
  pol_index <- scale(pol_index)
  weights <- cov(pol_index)
  weights <- solve(weights)
  weights <- colSums(weights)
  pol_index <- apply(pol_index, 1, weighted.mean, w = weights)
  nodes$pol_index <- pol_index
  
  ties <- df[,c("resid","id","connection")]
  number <- regexpr("[0-9]", ties$connection)
  # ties$order <- ifelse(number == -1, NA, as.numeric(substr(ties$connection, number, number)))
  ties$type <- ifelse(number == -1, ties$connection, substr(ties$connection, 1, number-1))
  ties$connection <- NULL
  colnames(ties) <- c("i", "j", "type")
  ties$type[ties$type == "member"] <- "family"
  ties <- ties[ties$i != ties$j,]
  ties <- ties[!duplicated(ties),]
  
  # add in non-interviewed nodes
  missing <- unique(ties$j[!ties$j %in% nodes$i])
  nodes <- rbind(nodes, 
                 data.frame(i = missing, 
                            interviewed = F, 
                            heard = NA, 
                            adopt = NA, 
                            age = NA, 
                            female = NA,
                            income = NA,
                            edu = NA,
                            phone = NA, 
                            immigrant = NA, 
                            is_leader_obj = NA, 
                            lat = NA,
                            lon = NA, 
                            nodist = NA, 
                            efficacy_int = NA, 
                            efficacy_ext = NA, 
                            pol_index = NA, 
                            prosoc_dic = NA, 
                            prosoc_pub = NA, 
                            attend = NA, 
                            satisfaction = NA, 
                            satisfaction2 = NA, 
                            sent = NA, pborrow = NA, plend = NA, picontact = NA, 
                            no_dk = NA, no_dksms = NA, no_phone = NA, no_worth = NA, no_way = NA), 
                 stringsAsFactors = F)
  leaders <- unique(ties$j[ties$type == "Leader"])
  # nodes$is_leader <- nodes$i %in% leaders
  return(list(nodes = nodes, 
              ties = ties))
 }





 getStatistics <- function(g) {
  comp_g <- components(g)
  g_large <- groups(comp_g)
  # g_large <- induced.subgraph(g, g_large[[which.max(comp_g$csize)]])
  if(g$etype %in% c("family","friend","solver","lender","union")) {
    graph_level <- data.frame(village = g$village, 
                              etype = g$etype, 
                              n_nodes = vcount(g), 
                              n_ties = ecount(g), 
                              diameter = diameter(g), 
                              mean_deg = mean(degree(g)), 
                              mean_deg_in = ifelse(is.directed(g), mean(degree(g, mode = "in")), NA), 
                              mean_deg_out = ifelse(is.directed(g), mean(degree(g, mode = "out")), NA), 
                              density = graph.density(g), 
                              mean_dist = mean_distance(g), 
                              clustering_coef = transitivity(g, type = "global"), 
                              n_ntrivial_comp = length(comp_g$csize[comp_g$csize > 1]), 
                              n_lcomp = max(comp_g$csize), 
                              pct_lcomp = max(comp_g$csize)/vcount(g), 
                              n_isolates = length(degree(g)[degree(g)==0]), 
                              pct_isolates = length(degree(g)[degree(g)==0])/vcount(g), 
                              reciprocity = ifelse(is.directed(g), reciprocity(g), NA), 
                              stringsAsFactors = F)
    
    node_level <- data.frame(village = g$village, 
                             etype = g$etype, 
                             i = V(g)$name, 
                             degree = degree(g), 
                             degree_in = ifelse(is.directed(g), degree(g, mode = "in"), NA), 
                             degree_out = ifelse(is.directed(g), degree(g, mode = "out"), NA), 
                             clustering_coef = transitivity(g, type = "local"), 
                             between = centr_betw(g)$res, 
                             close = centr_clo(g)$res, 
                             eigen = centr_eigen(g)$vector, 
                             stringsAsFactors = F)
  } else if(g$etype == "Leader") {
    graph_level <- data.frame(village = g$village, 
                              etype = g$etype, 
                              n_nodes = vcount(g), 
                              n_ties = ecount(g), 
                              n_ntrivial_comp = length(comp_g$csize[comp_g$csize > 1]), 
                              n_lcomp = max(comp_g$csize), 
                              pct_lcomp = max(comp_g$csize)/vcount(g), 
                              n_isolates = length(degree(g)[degree(g,mode="all")==0]), 
                              pct_isolates = length(degree(g)[degree(g,mode="all")==0])/(vcount(g)-length(comp_g$csize[comp_g$csize > 1])))
    node_level <- NULL
  } else {
    graph_level <- NULL
    node_level <- NULL
  }
  return(list(graph_level = graph_level, 
              node_level = node_level))
 }



 processVillage <- function(df, village) {
  df <- df[df$village_rec == village,]
  df <- cleanDf(df)
  
  networks <- makeNetworks(df$nodes, df$ties, village)
  stats_construct <- networks$stats_construct
  networks <- networks$networks
  etypes <- names(networks)
  stats <- lapply(networks, getStatistics)
  stats_lead <- stats[[which(etypes == "Leader")]]$graph_level
  rownames(stats_lead) <- NULL
  
  stats_graph <- lapply(stats[etypes != "Leader"], function(l) l$graph_level)
  stats_graph <- do.call(rbind, stats_graph)
  stats_graph <- merge(stats_graph, stats_construct)
  stats_graph$pct_no_interview <- stats_graph$n_no_interview / (stats_graph$n_no_interview + stats_graph$n_nodes)
  rownames(stats_graph) <- NULL
  
  stats_node <- lapply(stats[etypes != "Leader"], function(l) l$node_level)
  stats_node <- do.call(rbind, stats_node)
  rownames(stats_node) <- NULL
  
  return(list(village = village, 
              networks = networks, 
              stats_graph = stats_graph, 
              stats_node = stats_node, 
              stats_lead = stats_lead))
 }

 processVillages <- function(df) {
  villages <- unique(d$village_rec)
  v <- lapply(villages, function(v) tryCatch(processVillage(df,v), 
                                             error = function(m) return(m)))
  names(v) <- villages
  return(v)
 }



 prepareVillage <- function(village) {
  if(is.null(village)) return(NULL)
  n <- list(union = list(as_adjacency_matrix(village$networks$union, sparse = F)), 
            solver = list(as_adjacency_matrix(village$networks$solver, sparse = F)), 
            lender = list(as_adjacency_matrix(village$networks$lender, sparse = F)), 
            family = list(as_adjacency_matrix(village$networks$family, sparse = F)), 
            friend = list(as_adjacency_matrix(village$networks$friend, sparse = F)), 
            leader = list(as_adjacency_matrix(village$networks$Leader, sparse = F)), 
            speak = list(as_adjacency_matrix(village$networks$speak, sparse = F)), 
            strong_ties = list(as_adjacency_matrix(village$networks$strong_ties, sparse = F)), 
            weak_ties = list(as_adjacency_matrix(village$networks$weak_ties, sparse = F)), 
            leader_obj = list(as_adjacency_matrix(village$networks$leader_obj, sparse = F)), 
            geo = list(as_adjacency_matrix(village$networks$geo, sparse = F, attr = "weight")), 
            df = as_data_frame(village$networks$union, what = "vertices"))
  n$df$heard <- as.numeric(n$df$heard)
  n$df$adopt <- as.numeric(n$df$adopt)
  n$df$is_leader <- degree(village$networks$Leader, mode = "in") > 0
  n$heard <- data.frame(t1 = n$df$heard, row.names = rownames(n$df))
  n$adopt <- data.frame(t1 = n$df$adopt, row.names = rownames(n$df))
  return(n)
 }

 prepare <- function(villages) {
  out <- lapply(villages, prepareVillage)
  names(out) <- names(villages)
  return(out)
 }

 fit <- function(y, formula.glm, formula.tnam, data, sub = NULL, rename = NULL, ...) {
  if(!is.null(sub)) data <- data[sub]
  
  df.glm <- lapply(data, function(l) {
    df.glm <- model.frame(formula.glm, l$df)
    for (i in 1:length(colnames(df.glm))) {
      if(is.logical(df.glm[,i])) df.glm[,i] <- as.numeric(df.glm[,i])
    }
    df.glm$node <- rownames(df.glm)
    return(df.glm)
  })
  df.glm <- do.call(rbind, df.glm)
  if(!is.null(formula.tnam)) {
    df.tnam <- lapply(data, function(n) {
      makeCol <- function(v) {
        out <- data.frame(t1 = v)
        rownames(out) <- rownames(n$df)
        out
      }
      env <- new.env()
      isActive <- as.integer(n$df$pol_index > 0.1625646)
      assign("uni", n$union, envir = env)
      assign("solver", n$solver, envir = env)
      assign("lender", n$lender, envir = env)
      assign("family", n$family, envir = env)
      assign("friend", n$friend, envir = env)
      assign("leader", n$leader, envir = env)
      assign("leader_obj", n$leader_obj, envir = env)
      assign("is_leader", makeCol(n$df$is_leader), envir = env)
      assign("is_leader_obj", makeCol(n$df$is_leader_obj), envir = env)
      assign("is_peer_obj", makeCol(1-n$df$is_leader_obj), envir = env)
      assign("is_active", makeCol(isActive), envir = env)
      assign("is_inactive", makeCol(1-isActive), envir = env)
      assign("geo", n$geo, envir = env)
      assign("heard", n$heard, envir = env)
      assign("adopt", n$adopt, envir = env)
      assign("speak", n$speak, envir = env)
      satisfaction <- data.frame(t1 = n$df$satisfaction, row.names = n$df$name)
      satisfaction2 <- data.frame(t1 = n$df$satisfaction2, row.names = n$df$name)
      assign("satisfaction", satisfaction, envir = env)
      assign("satisfaction2", satisfaction2, envir = env)
      assign("weak_ties", n$weak_ties, envir = env)
      assign("strong_ties", n$strong_ties, envir = env)
      assign("leaderAdopt", makeCol(n$df$is_leader_obj * n$df$adopt))
      assign("peerAdopt", makeCol((1-n$df$is_leader_obj) * n$df$adopt))
      assign("activeAdopt", makeCol(isActive * n$df$adopt))
      assign("inactiveAdopt", makeCol((1-isActive) * n$df$adopt))
      environment(tnamdata) <- env
      df.tnam <- tnamdata(formula.tnam)
      df.tnam <- df.tnam[,-(1:2)]
      return(df.tnam)
    })
    cols <- sapply(df.tnam, colnames)
    cols <- apply(cols, 1, function(i) rev(sort(unique(i)))[1])
    df.tnam <- lapply(df.tnam, function(df) {
      colnames(df) <- cols
      return(df)
    })
    df.tnam <- do.call(rbind, df.tnam)
    if(!is.null(rename)) colnames(df.tnam)[-1] <- rename
    df <- merge(df.glm, df.tnam)
  } else {
    df <- df.glm
  }
  nodes <- df$node
  df$node <- NULL
  formula <- as.formula(paste0(y, "~."))
  mod <- glm(formula, data = df, ...)
  # mod <- lm(formula, data = df, ...)
  return(list(mod = mod, 
              nodes = nodes, 
              formula.glm = formula.glm, 
              formula.tnam = formula.tnam))
 }



 simIter <- function(mod, y, offset, coef, mnet, mdist) {
  adopt <- data.frame(t1 = y)
  env <- new.env()
  assign("uni", mnet, envir = env)
  assign("geo", mdist, envir = env)
  assign("adopt", adopt, envir = env)
  environment(tnamdata) <- env
  df.tnam <- tnamdata(mod$formula.tnam)
  df.tnam <- df.tnam[,-(1:2)]
  df.tnam$node <- NULL
  df.tnam <- as.matrix(df.tnam)
  
  pr <- as.numeric(1/(1+exp(-(offset + df.tnam %*% coef))))
  
  y.new <- sapply(pr[!as.logical(y)], rbinom, size = 1, n = 1)
  y[!as.logical(y)] <- y.new
  
  return(list(y = y, pr = pr))
 }




 simulate <- function(mod, offset, coef, mnet, mdist, i = NULL, maxit = 150, verbose = F, seeds = NULL) {
  nobs <- nrow(mnet)
  y <- rep(0,nobs)
  if(!is.null(seeds)) y <- seeds
  if(is.null(i)) i <- 1:nobs
  rownames(mnet) <- 1:nobs
  rownames(mdist) <- 1:nobs
  output <- data.frame(t = 0, 
                       i = i, 
                       y = y, 
                       pr = 0)
  t <- 0
  while(sum(y) < nobs & t < maxit) {
    t <- t+1
    it <- simIter(mod, y, offset, coef, mnet, mdist)
    output <- rbind(output, 
                    data.frame(t = t, 
                               i = i, 
                               y = it$y, 
                               pr = it$pr))
    y <- it$y
    if (verbose) message("t = ", t, 
                         "; pct = ", round(sum(y)/nobs), 
                         "; Pr(adopt) = ", round(mean(it$pr[it$y == 0]), 4))
    
  }
  return(output)
 }


 bootPredict <- function(formula, coefs, vcov, newdata, n) {
  boot <- mvrnorm(n, coefs, vcov)
  df <- model.matrix(formula, data = newdata)
  predict <- df %*% t(boot)
  predict <- 1/(1+exp(-predict))
  return(predict)
 }

 toOffset <- function(x) -log(1/x - 1)


 adjust <- function(g1, g2) {
  if(vcount(g1) == vcount(g2)) {
    return(NULL)
  } else if (vcount(g1) < vcount(g2)) {
    gsmall <- g1
    glarge <- g2
  } else {
    gsmall <- g2
    glarge <- g1
  }
  diff <- vcount(glarge) - vcount(gsmall)
  deg <- table(degree(glarge))
  min.sat <- as.numeric(names(deg)[max(which(cumsum(deg) <= diff))])
  max.sat <- as.numeric(names(deg)[min(which(cumsum(deg) > diff))])
  select <- V(glarge)[degree(glarge)  <= min.sat]
  if (max.sat > min.sat) {
    select <- c(select, 
                sample(V(glarge)[degree(glarge) == max.sat], diff - length(select)))
  }
  glarge <- glarge - select
  return(glarge)
 }



 getSeeds <- function(g, n, strat) {
  if (strat == "base") {
    y <- as.numeric(V(g) %in% sample(V(g),n))
  } else if (strat == "cty") {
    y0 <- sample(V(g),1)
    y <- y0
    sizes <- sapply(1:5, neighborhood.size, graph = g, nodes = y0)
    
    max.sat <- min(which(sizes > n))
    min.sat <- max(which(sizes <= n))
    if(min.sat != -Inf) y <- unique(c(y, ego(g,min.sat,y0)[[1]]))
    if (max.sat > min.sat) {
      target <- ego(g, max.sat, y0)[[1]]
      target <- target[!target %in% y]
      y <- c(y, sample(target, n-length(y)))
      y <- as.numeric(V(g) %in% y)
    }
  } else {
    weight <- degree(g, V(g))/sum(degree(g, V(g)))
    y <- as.numeric(V(g) %in% sample(V(g),n,prob = weight))
  }
  return(y)
 }



 aggregateSims <- function(sims) {
  maxt <- max(sapply(sims, function(sim) sapply(sim, function(df) max(df$t))))
  sims <- lapply(sims, function(sim) lapply(sim, function(df) {
    df <- aggregate(y ~ t + sim + type, df, mean)
    sim <- df$sim[1]
    type <- df$type[1]
    df <- merge(df, data.frame(t=1:maxt), all = T)
    df[is.na(df)] <- 1
    df$sim <- sim
    df$type <- type
    return(df)
  }))
  sims <- lapply(sims, function(sim) do.call(rbind, sim))
  sims <- do.call(rbind, sims)
  sims$sim <- paste0(sims$sim, sims$type)
  sims$sim <- match(sims$sim, unique(sims$sim))
  return(sims)
 }




 topUp <- function(g, ediff, strat, cut = .1) {
  if (strat == "random") {
    select <- length(g[(!g) & lower.tri(g)])
    select <- sample.int(n = select, size = ediff)
    g[(!g) & lower.tri(g)][select] <- 1
    g <- t(g)
    g[(!g) & lower.tri(g)][select] <- 1
  } else {
    diag(g) <- 1
    n <- nrow(g)
    for (k in 1:ediff) {
      deg <- colSums(g)
      if (strat == "low") {
        ccut <- quantile(deg, cut)
        select <- which(deg <= ccut & deg < n)
      } else {
        ccut <- quantile(deg, 1-cut)
        select <- which(deg >= ccut & deg < n)
      }
      if (length(select)  == 0) {
        stop("target  is fully connected")
      } else if (length(select) == 1) {
        i <- select
      } else {
        i <- i <- sample(select, 1)
      }
      j <- sample(which(!g[i,]), 1)
      if (length(j) > 1) j <- sample(j, 1)
      g[i,j] <- g[j,i] <- 1
    }
    diag(g) <- 0
    
  }
  return(g)
 }



 fit2 <- function(formula.glm.hear, formula.tnam.hear = NULL, 
                 formula.glm.adopt, formula.tnam.adopt = NULL, 
                 rename.hear = NULL,  rename.adopt = NULL, 
                 data, bayes = F, clogit = F, ...) {
  # if(!is.null(sub)) data <- data[sub]
  
  df.glm.hear <- lapply(data, function(l) {
    df.glm <- model.frame(formula.glm.hear, l$df)
    for (i in 1:length(colnames(df.glm))) {
      if(is.logical(df.glm[,i])) df.glm[,i] <- as.numeric(df.glm[,i])
    }
    df.glm$node <- rownames(df.glm)
    return(df.glm)
  })
  df.glm.hear <- do.call(rbind, df.glm.hear)
  
  df.glm.adopt <- lapply(data, function(l) {
    df.glm <- model.frame(formula.glm.adopt, l$df)
    for (i in 1:length(colnames(df.glm))) {
      if(is.logical(df.glm[,i])) df.glm[,i] <- as.numeric(df.glm[,i])
    }
    df.glm$node <- rownames(df.glm)
    return(df.glm)
  })
  df.glm.adopt <- do.call(rbind, df.glm.adopt)
  
  
  if(!is.null(formula.tnam.hear)) {
    df.tnam.hear <- lapply(data, function(n) {
      env <- new.env()
      assign("uni", n$union, envir = env)
      assign("solver", n$solver, envir = env)
      assign("lender", n$lender, envir = env)
      assign("family", n$family, envir = env)
      assign("friend", n$friend, envir = env)
      assign("leader", n$leader, envir = env)
      assign("leader_obj", n$leader_obj, envir = env)
      assign("geo", n$geo, envir = env)
      assign("heard", n$heard, envir = env)
      assign("adopt", n$adopt, envir = env)
      assign("is_leader", n$df$is_leader, envir = env)
      assign("is_leader_obj", n$df$is_leader_obj, envir = env)
      assign("weak_ties", n$weak_ties, envir = env)
      assign("strong_ties", n$strong_ties, envir = env)
      assign("speak", n$speak, envir = env)
      satisfaction <- data.frame(t1 = n$df$satisfaction, row.names = n$df$name)
      satisfaction2 <- data.frame(t1 = n$df$satisfaction2, row.names = n$df$name)
      assign("satisfaction", satisfaction, envir = env)
      assign("satisfaction2", satisfaction2, envir = env)
      environment(tnamdata) <- env
      df.tnam <- tnamdata(formula.tnam.hear)
      df.tnam <- df.tnam[,-(1:2)]
      return(df.tnam)
    })
    cols <- sapply(df.tnam.hear, colnames)
    cols <- apply(cols, 1, function(i) rev(sort(unique(i)))[1])
    df.tnam.hear <- lapply(df.tnam.hear, function(df) {
      colnames(df) <- cols
      return(df)
    })
    df.tnam.hear <- do.call(rbind, df.tnam.hear)
    if(!is.null(rename.hear)) colnames(df.tnam.hear)[-1] <- rename.hear
    df.hear <- merge(df.glm.hear, df.tnam.hear)
    df.hear <- df.hear[, 
                       c(colnames(df.tnam.hear)[-which(colnames(df.tnam.hear) == "node")], 
                         colnames(df.glm.hear))]
  } else {
    df.hear <- df.glm.hear
  }
  
  if(!is.null(formula.tnam.adopt)) {
    df.tnam.adopt <- lapply(data, function(n) {
      env <- new.env()
      assign("uni", n$union, envir = env)
      assign("solver", n$solver, envir = env)
      assign("lender", n$lender, envir = env)
      assign("family", n$family, envir = env)
      assign("friend", n$friend, envir = env)
      assign("leader", n$leader, envir = env)
      assign("leader_obj", n$leader_obj, envir = env)
      assign("is_leader", n$df$is_leader, envir = env)
      assign("is_leader_obj", n$df$is_leader_obj, envir = env)
      assign("geo", n$geo, envir = env)
      assign("heard", n$heard, envir = env)
      assign("adopt", n$adopt, envir = env)
      assign("speak", n$speak, envir = env)
      satisfaction <- data.frame(t1 = n$df$satisfaction, row.names = n$df$name)
      satisfaction2 <- data.frame(t1 = n$df$satisfaction2, row.names = n$df$name)
      assign("satisfaction", satisfaction, envir = env)
      assign("satisfaction2", satisfaction2, envir = env)
      assign("weak_ties", n$weak_ties, envir = env)
      assign("strong_ties", n$strong_ties, envir = env)
      environment(tnamdata) <- env
      df.tnam <- tnamdata(formula.tnam.adopt)
      df.tnam <- df.tnam[,-(1:2)]
      return(df.tnam)
    })
    cols <- sapply(df.tnam.adopt, colnames)
    cols <- apply(cols, 1, function(i) rev(sort(unique(i)))[1])
    df.tnam.adopt <- lapply(df.tnam.adopt, function(df) {
      colnames(df) <- cols
      return(df)
    })
    df.tnam.adopt <- do.call(rbind, df.tnam.adopt)
    if(!is.null(rename.adopt)) colnames(df.tnam.adopt)[-1] <- rename.adopt
    df.adopt <- merge(df.glm.adopt, df.tnam.adopt)
    df.adopt <- df.adopt[, 
                        c(colnames(df.tnam.adopt)[-which(colnames(df.tnam.adopt) == "node")], 
                          colnames(df.glm.adopt))]
  } else {
    df.adopt <- df.glm.adopt
  }
  
  
  # nodes <- intersect(df.hear$node, df.adopt$node)
  # df.hear <- df.hear[df.hear$node %in% nodes,]
  # df.adopt <- df.adopt[df.adopt$node %in% df$nodes,]
  df.adopt.full <- df.adopt[df.adopt$node %in% df.hear$node,]
  
  df.adopt <- df.adopt[df.adopt$node %in% df.hear$node[df.hear$hear == 1],]
  nodes <- df.hear$node
  nodesa <- df.adopt$node
  df.hear$node <- NULL
  df.adopt$node <- NULL
  df.adopt.full$node <- NULL
  
  if (bayes) {
    mod.hear <- bayesglm(heard ~ ., data = df.hear, ...)
    mod.adopt <- bayesglm(adopt ~ ., data = df.adopt, ...)
  } else if (clogit) {
    mod.hear <- clogit(heard ~ . - village + strata(village), data = df.hear, model = TRUE, y = TRUE, ...)
    mod.adopt <- clogit(adopt ~ . - village + strata(village), data = df.adopt, model = TRUE, y = TRUE, ...)
    mod.hear$AIC <- AIC(mod.hear)
    mod.adopt$AIC <- AIC(mod.adopt)
  } else {
    mod.hear <- glm(heard ~ ., data = df.hear, ...)
    mod.adopt <- glm(adopt ~ ., data = df.adopt, ...)
  }
  
  obj <- list(nodes = nodes, 
              nodesa = nodesa, 
              mod.hear = mod.hear, 
              mod.adopt = mod.adopt, 
              df.adopt.full = df.adopt.full, 
              formula.glm.hear = formula.glm.hear, 
              formula.glm.adopt = formula.glm.adopt,
              formula.tnam.hear = formula.tnam.hear, 
              formula.tnam.adopt = formula.tnam.adopt)
  if(clogit) obj$loglik <- mod.hear$loglik[2] + mod.adopt$loglik[2]
  obj$AIC <- 2 * (length(coef(obj$mod.hear)) +  length(coef(obj$mod.adopt)) - obj$loglik)
  class(obj) <- "mfit2"
  return(obj)
 }

 predict.mfit2 <- function(obj, dfHear = NULL, dfAdopt = NULL) {
  if(is.null(dfHear) || is.null(dfAdopt)) {
    return(predict(obj$mod.hear, type = "response") * 
             predict(obj$mod.adopt, newdata = obj$df.adopt.full, type = "response"))
  }
  return(predict(obj$mod.hear, newdata = dfHear, type = "response") * 
           predict(obj$mod.adopt, newdata = dfAdopt, type = "response"))
 }

 summary.mfit2 <- function(obj) summary(obj$mod.adopt)
No results found