Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

Tou Mou

Guten Tag ,

Ich habe diese R-Funktion entwickelt, die Daten in Buckets hasht:

#   The used packages 
    library("pacman")
    pacman::p_load(dplyr, tidyr, devtools, MASS, pracma, mvtnorm, interval, intervals) 
    pacman::p_load(sprof, RDocumentation, helpRFunctions, foreach , philentropy , Rcpp , RcppAlgos) 


  hash<-function(v,p){
  if(dot(v,p)>0) return(1) else (0)   }

  LSH_Band<-function(data,K ){

  # We retrieve numerical columns of data 
  t<-list.df.var.types(data)
  df.r<-as.matrix(data[c(t$numeric,t$Intervals)])
  n=nrow(df.r)

  # we create K*K matrice using normal law
  rn=array(rnorm(K*K,0,1),c(K,K))
  # we create K*K matrice of integers using uniform law , integrs are unique in each column
  rd=unique.array(array(unique(ceiling(runif(K*K,0,ncol(df.r)))),c(K,K)))

  buckets<-array(NA,c(K,n)) 
    for (i in 1:K) {
      for (j in 1:n) {
        buckets[i,j]<-hash(df.r[j,][rd[,i]],rn[,i])
      }
    }   
  return(buckets)   
}
> df.r
  age height salaire.1 salaire.2
1  27    180         0      5000
2  26    178         0      5000
3  30    190      7000     10000
4  31    185      7000     10000
5  31    187      7000     10000
6  38    160     10000     15000
7  39    158     10000     15000
> LSH_Band(df.r, 3 )
     [,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,]    1    1    1    1    1    1    1
[2,]    1    1    0    0    0    0    0
[3,]    0    0    0    0    0    0    0

Die Punktfunktion ist das Skalarprodukt zweier Vektoren.

Meine Lsh-Funktion nimmt eine Zeile meiner Daten und dann einen Teil der erhaltenen Zeile mit df.r[j,][rd[,i]]. df.r[j,]ist j-éme Zeile der Daten.
rd[,i] : rd ist eine K * K-Matrix von ganzen Zahlen zwischen 1 und ncol (df.r). Jede Spalte der Matrix enthält nur eindeutige ganze Zahlen.
rn[,i] : rn ist eine K * K-Matrix, die Werte des N (0,1) -Gesetzes enthält.
In der resultierenden Tabelle werden Beobachtungen in Spalten dargestellt. Ich werde k Zeilen haben. Für die letzte Zeile werde ich das Skalarprodukt zwischen df.r[j,][rd[,K]]und berechnen rn[,K]. Ich werde 1 erhalten, wenn das Skalarprodukt positiv ist. rd[,K]und rn[,K]wird nur für die letzte Zeile in der resultierenden Tabelle und für alle Beobachtungen in dieser Zeile verwendet.

Meine Frage :

Soll die Schleife durch die Variablen i und j durch eine Lapply-Funktion ersetzt werden ?

Meine realen Daten werden groß sein, deshalb stelle ich diese Frage.

Vielen Dank !

Maurits Evers

Das Folgende ist als Kommentar etwas zu lang, daher hier einige Hinweise / Probleme / Bemerkungen:

Zunächst muss ich sagen, dass ich Schwierigkeiten habe zu verstehen, was LHS_Bandtut. Vielleicht würde hier ein Kontext helfen.
Ich verstehe den Zweck bestimmter Funktionen nicht, helpRFunctions::list.df.var.typedie einfach die Spaltennamen von datain a zurückzugeben scheinen list. Beachten Sie auch, dass die t$IntervalsRückgabe NULLauf den von Ihnen angegebenen Beispieldaten basiert. Ich bin mir also nicht sicher, was dort los ist.
Ich sehe den Funktionspunkt auch pracma::dotnicht. Das Punktprodukt zwischen zwei Vektoren kann in Basis R unter Verwendung von berechnet werden %*%. Es ist wirklich kein zusätzliches Paket erforderlich.
Funktion hashkann kompakter geschrieben werden als
```
hash <-  function(v, p) +(as.numeric(v %*% p) > 0)
```
Dies vermeidet die ifBedingung, die langsam ist.

Ungeachtet meines Unverständnisses, was Sie versuchen zu tun, sind hier einige Verbesserungen an Ihrem Code

hash <-  function(v, p) +(as.numeric(v %*% p) > 0)

LSH_Band <- function(data, K, seed = NULL) {

    # We retrieve numerical columns of data
    data <- as.matrix(data[sapply(data, is.numeric)])
    # we create K*K matrice using normal law
    if (!is.null(seed)) set.seed(seed)
    rn <- matrix(rnorm(K * K, 0, 1), nrow = K, ncol = K)
    # we create K*K matrice of integers using uniform law , integrs are unique in each column
    rd <- sapply(seq_len(K), function(col) sample.int(ncol(data), K))
    buckets <- matrix(NA, nrow = K, ncol = nrow(data))
    for (i in 1:K) {
        buckets[i, ] <- apply(data, 1, function(row) hash(row[rd[, i]], rn[, i]))
    }
    buckets
}

Fügen Sie immer eine Option hinzu, um ein Reproduzierbares zu verwenden, seedwenn Sie mit Zufallszahlen arbeiten. Das macht das Debuggen viel einfacher.
Sie können mindestens eine forSchleife durch ersetzen apply(die bei Verwendung MARGIN = 1durch die Zeilen eines matrix(oder array) iteriert ).
Ich habe alle unnötigen Paketabhängigkeiten entfernt und die Funktionalität durch Basis-R-Funktionen ersetzt.

Wie kann ich eine verschachtelte for-Schleife in Python unterbrechen?

user3616181 Ich frage mich, wie ich so aus der Schleife herauskomme: for a in range(95): for b in range(95): for c in range(95): for d in range(95): ... do some computings ...

Wie erstelle ich eine verschachtelte Schleife für jede Schleife mit PySpark?

Matthias Stellen Sie sich einen großen Datensatz (> 40 GB Parkettdatei) vor, der Wertbeobachtungen von Tausenden von Variablen als Tripel (Variable, Zeitstempel, Wert) enthält . Stellen Sie sich nun eine Abfrage vor, an der Sie nur an einer Teilmenge von 500 V

Wie kann ich mit openmp in C eine for-Schleife parallelisieren, die eine verschachtelte Vergleichsfunktion für qsort enthält?

Agargara Ich möchte eine forSchleife parallelisieren , die eine verschachtelte Vergleichsfunktion für qsort enthält: #include <stdio.h> #include <stdlib.h> #include <omp.h> int main(){ int i; #pragma omp parallel for for(i = 0; i < 100; i++){

Wie kann ich itertools für eine verschachtelte Schleife verwenden?

undicht Ich suche nach einer Methode, itertools.accumulatein der ich sie verwenden kann starmap. Ich habe versucht, die akkumulierte Summe jeder Zeile in einer Tabelle zu berechnen und dann die Ergebnisse zu einem Array zu verketten: # my input my_table = [[3,

Wie kann ich eine verschachtelte Schleife mit einer inneren Schleife implementieren, indem ich den Index des äußeren Schleifenindex als Basis für die Inkrementierung in R verwende?

Mike0298 Wie implementiere ich in R eine verschachtelte Schleife, deren innere Schleife den Index der äußeren Schleife verwendet? Hier ist das Beispiel des Codes, den ich in C # geschrieben habe: int[] days = [1,2,3,4,5,6,7,8,9,10]; int[] amounts = [100, 0, 30

wie man eine verschachtelte Schleife in lapply in r konvertiert

omid jahadi Ich habe eine Liste mit dem Namen "dahak", die 30000 Zahlen zwischen 1 und 10 enthält. Ich möchte jede Zahl mit der gesamten Zahl in der Liste überprüfen. Wenn zwei Zahlen gleich sind, füge Nummer 1 an weight_list an, wenn zwei Zahlen nicht gleich

Was kann eine verschachtelte Schleife in R . ersetzen?

Ana Ich möchte den Datenrahmen outputaus Datenrahmen inputin R erstellen, indem ich mehrere Szenarien mit zwei Variablen xund y. Die Spalte outputist die Summe aller Werte in der Spalte, valuein der xcol < x & ycol < y. input = xcol ycol value 1 5 4 2 6

Wie kann ich hier eine verschachtelte Schleife vermeiden? mit php

Demeteor Ich habe diese Schleife hier und möchte all diese Elemente aus jedem Jahr und Quartal in meinem Array speichern, damit ich die Durchschnittswerte pro Quartal erhalten kann, aber es scheint mir viel zu schlecht zu sein. und ich kann mir nicht vorstelle

Wie schreibe ich eine for-Schleife mit einem Zähler für eine verschachtelte Liste?

Anna Y. Ich versuche, nur gerade Werte aus einer verschachtelten Liste auszuwählen und auch zu verfolgen, wie viele gerade Zahlen in jedem Element der verschachtelten Liste waren. Wenn ich das beispielsweise habe, möchte ich alle geraden Zahlen und auch die Ge

Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

Verwandte Artikel

Liste